Statistique 
et probabilités 


Cours et exercices corrigés 


Jean-Pierre Lecoutre 


Statistique 
et probabilités 


Cours et exercices corrigés 


Jean-Pierre Lecoutre 


Maître de conférences honoraire à l'université Panthéon-Assas (Paris Il) 


6° édition 


DUNOD 


d'enseignement supérieur, provoquant une 
baisse brutale des achats de livres et de 
revues, au point que la possibilité même pour 
les auteurs de créer des œuvres 
nouvelles et de les faire éditer cor- 


Le pictogramme qui figure ci-contre 
mérite une explication. Son objet est 
d'alerter le lecteur sur la menace que 
représente pour l'avenir de l'écrit, 
particulièrement dans le domaine 


DANGER 


de l'édition technique et universi- 
taire, le développement massif du 
photocopillage. 

Le Code de la propriété intellec- 


rectement est aujourd'hui menacée. 
Nous rappelons donc que toute 
reproduction, partielle ou totale, 
de la présente publication est 


interdite sans autorisation de 
l'auteur, de son éditeur ou du 
Centre français d'exploitation du 
droit de copie (CFC, 20, rue des 
Grands-Augustins, 75006 Paris). 


tuelle du 1° juillet 1992 interdit 
en effet expressément la photoco- 
pie à usage collectif sans autori- 
sation des ayants droit. Or, cette pratique 
s'est généralisée dans les établissements 


LE PHOTOCOPILLAGE 
TUE LE LIVRE 


© Dunod, 2016 
11 rue Paul Bert, 92240 Malakoff 
www.dunod.com 
ISBN 978-2-10-075259-1 


Le Code de la propriété intellectuelle n'autorisant, aux termes de l'article 
L. 122-5, 2° et 3° a}, d'une part, que les « copies ou reproductions strictement 
réservées à l’usage privé du copiste et non destinées à une utilisation collective » 
et, d'autre part, que les analyses et les courtes citations dans un but d'exemple et 
d'illustration, « toute représentation ou reproduction intégrale ou partielle faite 
sans le consentement de l'auteur ou de ses ayants droit ou ayants cause est 
illicite » (art. L. 122-4). 

Cette représentation ou reproduction, par quelque procédé que ce soit, constitue- 
rait donc une contrefaçon sanctionnée par les articles L. 335-2 et suivants du 
Code de la propriété intellectuelle. 


© Dunod. Toute reproduction non autorisée est un délit. 


vant-propos 


Ce manuel de cours est destiné principalement aux étudiants de la Licence 
économie et gestion mais peut être utile à toute personne souhaitant connaître et 
surtout utiliser les principales méthodes de la statistique inférentielle. Il corres- 
pond au programme de probabilités et statistique généralement enseigné dans 
les deux premières années de Licence (LI et L2). Cette 6° édition s’est enrichie 
d'exercices nouveaux. Le niveau mathématique requis est celui de la première 
année de Licence, avec quelques notions (séries, intégrales multiples) souvent 
enseignées seulement en deuxième année. 


Si une grande partie de l’ouvrage est consacrée à la théorie des probabilités, 
l’ordre des termes retenu dans le titre veut signifier qu’il ne s’agit que d’un outil 
au service de la statistique. Ce n’est qu’un passage obligé pour donner des bases 
rigoureuses à la méthode statistique. On peut le concevoir comme un ensemble 
de règles grammaticales, parfois difficiles et fastidieuses à retenir, mais qui per- 
mettent de rédiger des textes clairs, rigoureux et sans ambiguités, même si l’on 
n’a pas conscience qu’ils ont été écrits dans le respect de ces règles. La partie 
statistique correspond aux deux derniers chapitres d’estimation et de tests d’hy- 
pothèses. 


Les fondements théoriques de la statistique étant parfois délicats, nous avons 
choisi de présenter sans démonstration les principales propriétés nécessaires à 
une utilisation judicieuse des méthodes statistiques, en les illustrant systémati- 
quement d'exemples. De même, afin de ne pas alourdir les énoncés de théo- 
rèmes, les conditions techniques de leur validité ne sont pas présentées dans leur 
détail, parfois fastidieux, et qui risque de masquer l’essentiel qui est la proprié- 
té énoncée. Notre souci constant a été de faciliter la compréhension, pour pou- 
voir passer aisément au stade de l’utilisation, sans cependant pour cela sacrifier 
à la rigueur. La traduction anglaise des termes les plus usuels figure entre paren- 
thèses. 


Chaque chapitre se conclut par des exercices corrigés permettant de contrô- 
ler l’acquisition des notions essentielles qui y ont été introduites. Faire de nom- 
breux exercices est certainement le meilleur moyen d’arriver à la compréhension 
de certaines notions quelquefois difficiles. Rappelons cette maxime chinoise : 
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J'entends et j'oublie. Je vois et je retiens. Je fais et je comprends. En fin de cha- 
pitre se trouvent également quelques compléments ; soit de notions mathéma- 
tiques utilisées dans celui-ci, la combinatoire par exemple, soit de propriétés 
comme l’exhaustivité, très importantes et utiles, mais hors du programme d’une 
Licence d'économie ou de gestion. Avec ces compléments, cet ouvrage peut 
convenir aussi aux étudiants des écoles de management. 
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ntroduction 


La statistique a une origine très ancienne, se réduisant initialement à une col- 
lecte d’observations, notamment le dénombrement des hommes (recensement). 
On mentionne des opérations de recensement il y a plus de 4000 ans en Chine, 
en Mésopotamie ou en Égypte et la Bible en cite plusieurs, dans le Livre des 
Nombres par exemple. Cependant, le terme statistique est apparu assez récem- 
ment, vers le milieu du XVII siècle ; il vient du latin sfatisticus, relatif à l’état 
(status), et est employé alors dans un sens purement descriptif de recueil ou de 
collection de faits chiffrés, les sfatistiques. Le mot employé au singulier 
avec l’article défini, la statistique, évoque la méthode utilisée ensuite pour 
étendre des résultats et dégager des lois (l’inférence). Il s’agit donc dans ce sens 
d’un moyen scientifique d’analyse et de compréhension du phénomène étudié, 
s’appliquant très largement à l’économie et à toutes les sciences sociales et de la 
nature. 


Cette discipline concerne donc tous ceux qui ont à relever, présenter, analy- 
ser ou utiliser une information dont la masse peut être volumineuse. On peut 
la définir comme un ensemble de méthodes dont le but est de traiter des don- 
nées, les sfatistiques, relatives à un certain domaine d’étude. Elle traite égale- 
ment de la manière de recueillir ces données, auprès de qui et sous quelle forme 
(théorie des sondages). Son objectif peut se résumer de la façon suivante : déga- 
ger, à partir de données observées sur quelques individus d’une population, des 
résultats valables pour l’ensemble de la population. 


Cela consistera par exemple à remplacer des données nombreuses par des 
indicateurs (résumés) les plus pertinents possibles : résumé clair avec le mini- 
mum de perte d’information, permettant de dégager plus facilement un dia- 
gnostic. Il s’agit alors de la statistique descriptive qui recouvre les moyens 
de présenter ces données et d’en décrire les principales caractéristiques, en les 
résumant sous forme de tableaux ou de graphiques. Il s’agira ensuite de les 
interpréter. La description statistique se propose de mettre en évidence cer- 
taines permanences ou lois statistiques, qui peuvent éventuellement conduire à 
des prévisions (élément essentiel de l’étude des séries chronologiques). Une 
règle qui transforme un ensemble de données en une ou plusieurs valeurs numé- 
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riques se nomme une sfatistique, le terme étant cette fois utilisé avec l’article 
indéfini. 

Le début de la méthodologie statistique peut se situer au XVII siècle 
qui verra également l’éclosion d’un outil fondamental pour une formalisation 
tout à fait rigoureuse, la théorie des probabilités, qui est l’analyse mathématique 
des phénomènes dans lesquels le hasard intervient. Le calcul des probabilités 
a commencé avec Blaise Pascal, Pierre Fermat, Christian Huygens et 
Jacques Bernoulli par l’analyse des jeux dits de hasard. Le mot hasard est 
d’ailleurs emprunté à l’arabe az-zahr (jeu de dés, alea en latin) au XII° siècle, 
d’où est venue cette expression jeu de hasard au XVI siècle. La théorie des pro- 
babilités servira ensuite d’outil de base à un ensemble de méthodes ou de règles 
objectives permettant d’utiliser des données pour fixer la précision avec laquel- 
le on estime certains paramètres (théorie de l’estimation) ou on teste certaines 
hypothèses (théorie des tests) : la Sratistique mathématique (ou inférentielle). 
Ceci permet d’obtenir une mesure objective de la distance entre un modèle sta- 
tistique, traduit par une famille P, de lois de probabilité indexée par un para- 
mètre Ÿ parcourant un ensemble donné ©, et un ensemble de données obser- 
vées. 


Tout ceci peut se synthétiser au moyen du schéma suivant : 


Importance de la manière de les collecter 


Données — rat 
(théorie des sondages) 


a 


Présentation des données recueillies 
(statistique descriptive) 


Catalogue de modèles probabilistes disponibles et 
Modélisation |» outils nécessaires à la déduction 


(théorie des probabilités) 


Statistique mathématique : 


un modèle statistique paramétrique (P,; 0 € O) 
induction ou inférence statistique 


* estimation : quelle est le valeur de 0 ? 


° test : est-ce que 0 = & ou 0 = 6, ? 
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Il reste à préciser dans quel cadre cette formalisation à l’aide de modèles 
aléatoires sera nécessaire. Toute démarche scientifique nécessite la réalisation 
de certaines expériences que l’on peut regrouper en deux grandes catégories. 


e Pour certaines d’entre elles, si elles sont renouvelées dans des conditions tota- 
lement identiques, elles produiront le même résultat, qui devient donc prévi- 
sible. Il s’agit de phénomènes déterministes, où les faits sont régis par des lois 
universelles physiques (par exemple l’augmentation de la pression d’un gaz 
provoque une diminution de son volume, ce que traduit la loi de Mariotte : 
Pression x Volume = constante ; l’eau portée à 100 degrés Celsius se trans- 
forme en vapeur...). Le résultat est entièrement déterminé par les conditions de 
l'expérience : on peut prévoir le phénomène qui va se produire. 


+ Par contre, d’autres expériences ont toujours un résultat imprévisible (lan- 
cer d’un dé ou d’une pièce de monnaie) : effectuées dans des conditions tota- 
lement identiques elles donneront des résultats différents. Le résultat est non 
prévisible et on dit qu’il est dû au hasard, cette expression étant utilisée pour 
la première fois par Fénelon en 1695, le mot hasard étant compris maintenant 
au sens absolu et philosophique comme « sans évolution prévisible », à oppo- 
ser à déterministe. Dans son Essai philosophique sur les probabilités (1814), 
Laplace considère en effet que le déterminisme ne laisse aucune place au 
hasard : l’état de l’univers à un instant donné détermine son état à tout 
autre instant ultérieur. Ainsi, quand on jette en l’air une pièce de monnaie, les 
lois de la mécanique classique déterminent, en principe, avec certitude si elle 
retombera sur pile ou face. Le résultat n’est pas dû au hasard, mais à la maniè- 
re dont elle a été lancée en l’air et à la façon dont elle va retomber sur une cer- 
taine surface ; mais la trajectoire décrite par cette pièce avant de retomber sur 
pile est tellement complexe qu’il n’est pas possible de prévoir son issue. Le 
phénomène ne relève pas du déterminisme entendu au sens de la possibilité de 
prédiction, par le calcul ou la loi mathématique! Dans un mémoire de 1774, 
Laplace énonce que « le hasard n’a aucune réalité en lui-même : ce n’est 
qu’un terme propre à désigner notre ignorance. La notion de probabilité tient 
à cette ignorance ». Retenir un modèle probabiliste est donc simplement 
un aveu de notre ignorance, de notre incapacité à fournir un modèle physique 
décrivant une réalité trop complexe. On parle alors d’épreuve ou d’expérience 
aléatoire et le résultat obtenu sera un événement. Les outils appropriés dans ce 
cadre sont ceux de la statistique mathématique, la base de cette discipline 
étant la théorie des probabilités, que nous devrons donc étudier dans les six 
premiers chapitres de cet ouvrage, comme préalable aux deux chapitres d’es- 
timation et de tests d’hypothèses. 


1. Dans Science et méthode publié en 1908, Henri Poincaré exprime que hasard et déterminis- 
me sont rendus compatibles par l’imprédictibilité à long terme. Les relations entre hasard et 
déterminisme ont été dans les années 1980 l’objet d’une controverse animée entre les mathé- 
maticiens René Thom et Ilya Prigogine. L'étude récente des systèmes dynamiques montre que 
l’on ne peut pas confondre déterminisme et prédictibilité. En effet, une légère perturbation 
des conditions initiales d’un tel système mathématiquement déterministe peut empêcher de pré- 
voir son évolution future. 
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Otion 
de probabilité 


u cours de ce chapitre, nous allons donner la définition d'un cer- 

tain nombre de termes du vocabulaire utilisé dans un contexte 

non déterministe et indiquer comment construire le modèle adé- 
quat. La notion essentielle introduite étant bien sûr celle de probabilité, 
avec la notion d'indépendance d'événements qui lui est associée et qui 
joue un rôle très important en statistique. La représentation formelle du 
modèle probabiliste sous-jacent est presque toujours absente dans un 
problème concret de statistique. Cependant, cette formalisation rigou- 
reuse est indispensable pour obtenir les outils théoriques nécessaires à la 
résolution d'un tel problème statistique. 


Objectif du chapitre : montrer que le modèle probabiliste est choisi en 
fonction du but que l’on poursuit, qui se résume essentielle- 
ment à la construction du modèle d’échantillonnage, base de la 
modélisation statistique. 

Concepts clés étudiés : probabilité, probabilité conditionnelle, indépen- 
dance. 


odèle probabiliste 


nsemble fondamental 


Avant toute formalisation, le résultat d’une expérience aléatoire s’appelle évé- 
nement. La quantification des « chances » qu’un tel événement a de se réaliser 
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correspond à la notion intuitive de probabilité. Pour réaliser cette quantification, 
il est nécessaire de décrire au préalable, très précisément, l’ensemble des résul- 
tats possibles, appelés événements élémentaires. Cet ensemble expérimental 
s’appelle ensemble fondamental (ou univers) et est noté traditionnellement €2. 


> Exemple 1.1 
Jet d’un dé à six faces numérotées : = {1, 2, 3, 4,5, 6}. 


> Exemple 1.2 


On tire une boule dans une urne contenant une boule noire, deux 
blanches et cinq rouges et l’ensemble fondamental retenu est 
Q = {noire, blanche, rouge}. 


Chaque élément w € {2 représente donc un événement élémentaire, et toute 
partie À C {2 (ou À € P($2)) sera un événement. Parfois on dit que €2 est l’en- 
semble des éventualités possibles et les événements élémentaires sont alors les 
singletons, c’est-à-dire les ensembles réduits à un seul élément {w}, qui sont 
effectivement en toute rigueur des événements, puisque appartenant à P(Q), ce 
qui n’est pas le cas du point «. 


- Exemple 1.3 


À l’expérience du jet de dé on associe & = {1, 2, 3, 4, 5, 6} ; l'événement 
A = {1,2} traduit, c’est-à-dire représente symboliquement, le résultat 
« obtenir un résultat inférieur ou égal à 2 ». 


L'ensemble 2 dépend évidemment de l’expérience considérée, mais aussi du 
choix de celui qui construit le modèle, et par là présente donc un certain arbi- 
traire. 


- Exemple 1.4 


Dans l'expérience du jet de dé on peut choisir également 
Q = {pair, impair} ou = {{1, 2, 3,}, {4, 5, 6}}. 


> Exemple 1.5 


Si on tire une carte d’un jeu de 32 cartes, on peut retenir comme ensembles 
fondamentaux & = {7, 8,9, 10, V, D, R, As} ou Q = {trèfle, carreau. 
cœur, pique} ou 2 = {rouge, noir}. 


Cet ensemble {2 peut être fini ou infini, continu ou discret. 


> Exemple 1.6 


On lance une pièce jusqu'à obtenir pile, l'événement retenu étant le 
nombre de jets effectués : 


Q=f1,1..,n ie N 


ensemble infini dénombrable. 
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Exemple 1.7 
On observe la durée de vie d’une lampe : 


62 = [0, +oo[ =R, 
ensemble infini non dénombrable. 


L'ensemble retenu est bien sûr une abstraction et peut parfois contenir des 
événements qui ne se produiront jamais dans la réalité. 


Exemple 1.8 


On mesure la taille d’un individu choisi au hasard dans une population et 
on retient  =R, ; cet ensemble contient des très grandes tailles qui 
n'existent bien sûr pas dans la réalité, mais en raison de la difficulté de 
Jixer une valeur maximale de la taille pour définir l’ensemble fondamen- 
tal, c’est le choix qui paraît le moins arbitraire. 


lgèbre et tribu d'événements 


Un événement étant un élément de P(Q) obéit à la théorie des ensembles. Nous 
allons indiquer dans le tableau ci-après comment certaines notions ensemblistes 
s’expriment, ou se traduisent, en termes d'événements. 


Ensemble Événement 


On a observé le résultat w et wo € À | L'événement À est réalisé. 


A =B Les événements À et B sont identiques. 
ACB L'événement À implique l’événement B. 

ÿ Événement impossible. 

Q Événement certain. 

AUB Un au moins des deux événements est réalisé. 
ANB Les deux événements À et B sont réalisés. 
ANnB=ÿ Les événements À et B sont incompatibles. 
A=9Q -A ou A° L'événement À n’est pas réalisé. 


Le couple (QG, P(Q)) s’appelle un espace probabilisable. 


Cependant, même si @ est fini, le cardinal de P(Q) est 24%, qui peut être 
un nombre très grand. Dans ce cas, il peut être souhaitable de ne considérer 
qu’une famille restreinte À de parties de @, A CP(Q). Pour que le résultat des 
opérations ensemblistes (union, intersection, complémentaire) soit encore un 
événement, il est nécessaire que cette famille d’événements retenue soit fermée, 
ou stable, vis-à-vis de ces opérations, c’est-à-dire qu’il soit bien un élément de 
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la famille (par exemple, si on retient la famille des nombres impairs, elle n’est 
pas stable pour l’addition puisque le résultat est un nombre pair). De plus, les 
événements « certain », @, et « impossible », {, doivent également appartenir à 
cet ensemble. Aïnsi, on associera à une épreuve aléatoire un ensemble non vide 
de parties de Q, noté À, qui vérifiera : 


—[C;] pour tout À € À alors À € À; 


—|C;| pour tout À € À et tout B € À alors AUB € A. 


Il y a fermeture pour le complémentaire et l’union. Cet ensemble À s’appel- 
le une algèbre de parties de (2. Bien entendu, grâce aux lois de Morgan, on a une 
définition équivalente en remplaçant la condition C; par : 


—|C;]| pour tout À € À et tout B € À alors ANB € A. 


Exemple 1.9 
L’algèbre la plus élémentaire est réduite à A = {ÿ, Q}. 


Exemple 1.10 


À partir d'un événement quelconque A, on peut constituer l'algèbre : 
A= {9, À, A, A] 


Exemple 1.11 


On peut générer une algèbre à partir d’une partition. À partir de la par- 
tition de = {a, b, c, d} en trois ensembles {a, b}, {c}, {d} on construit 
l’algèbre : 


A = {ÿ, {a, b},{c}, {d}, {a, b, c,}, {a, b, d}, {c, d}, Q} 


avec card À = 2}. 


Exemple 1.12 
L’algèbre la plus complète est bien entendu P(Q). 


Propriétés d’une algèbre 


P, | La famille étant non vide, on en conclut que : 
ÿEeA., REA 


P, | Si À; € À pour 1 < j < n, on démontre par récurrence que : 


UA, € À 
j=1 
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P;|Si À, € À pour 1 < j < n, on démontre également par passage au com- 


M4, eA 
j=1 


plémentaire que : 


Cependant, certaines expériences peuvent se dérouler indéfiniment (au moins 
théoriquement), comme par exemple lancer un dé jusqu’à obtenir le chiffre 6. Si 
A, représente l’événement « obtenir le chiffre 6 au n-ème lancer », l’événement 
« obtenir le chiffre 6 » s’écrira À = U®,A,. On a donc besoin de renforcer la 
propriété P, de fermeture pour l’union finie par une condition de fermeture pour 
l’union dénombrable, soit : 


—|C;{ si À, € À pour tout n € N alors : 


[JA € A 
n=0 


condition qui exprime que toute union dénombrable d'événements est encore un 
événement. L’ensemble À auquel on impose les conditions C; et C; s’appelle 
alors une o — algèbre ou tribu d’événements. 


—% NB : On aurait pu remplacer dans la condition C; l’union par l’intersec- 
tion (par passage au complémentaire l’union se transforme en intersec- 
tion). Bien entendu toute algèbre finie est une o — algèbre. 


Cependant, dans les cas simples où @ est un ensemble fini, ou éventuelle- 
ment infini dénombrable, on peut retenir comme tribu des événements P(Q) 
tout entier. Ce n’est que dans les autres cas que l’on est amené à considérer des 
ensembles À plus réduits que P(Q) qui est alors trop vaste. Le couple formé de 
l’ensemble fondamental & et de la tribu d'événements associée À s’appelle un 
espace probabilisable. Cette terminologie signifie que l’on va pouvoir associer 
une probabilité, notée P, à ce modèle (Q, 4). 


robabilité 


Une fois défini l’ensemble des événements auxquels on s’intéresse, on va 
essayer de traduire par un nombre leurs « possibilités » de réalisation. Cela 
revient à affecter une mesure de « croyance » à chaque événement, c’est-à-dire 
un degré de certitude que l’on a que l’événement se produise ou non. Afin de 
correspondre à la notion intuitive, une probabilité sera un nombre associé à un 
événement, compris entre 0 et 1, pour pouvoir se convertir en pourcentage de 
« chances » ; l’événement certain { se voit attribuer la probabilité 1 et l’événe- 
ment impossible Ÿ la probabilité 0. Nous verrons dans l’exemple 6.6 que cette 
définition axiomatique est adaptée à la réalité, puisque la fréquence observée 
d’un événement a pour limite sa probabilité ainsi définie. D’autre part, si deux 
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événements sont incompatibles, c’est-à-dire ne peuvent pas se réaliser simulta- 
nément, la probabilité de réalisation de l’un des deux sera la somme de leurs 
probabilités respectives (par exemple pour un jet de dé P(1 ou 2) = P(1) 
+P(2) = 1/6 + 1/6 = 1/3). D'où la définition suivante : 


Définition 


On appelle probabilité P sur (@, A) une application P : À — [0,1] telle 
que : 


G) P(Q)=1; 


(ii) pour toute suite À, d’événements incompatibles, soit À, € À avec 


A, NA, = Ÿ pour m £ n : 
PU n) PA 
n=0 n=0 


propriété dite de o — additivité. 


—+ Remarque 


Pour toute suite d’événements quelconques, c’est-à-dire non disjoints, on 
a l’inégalité de Boole : 


HÜA) < rca) 
n=0 n=0 


Une probabilité est donc une application qui à un événement va associer un 
nombre. Le triplet (QG, À, P) s’appelle un espace probabilisé. Comme consé- 
quences de la définition on déduit les propriétés suivantes. 


Propriétés 


P, | L'événement impossible est de probabilité nulle : 
P(@) =0 


P, | La probabilité de l’événement complémentaire d’un événement quel- 
conque À s’obtient par : 


POAEN PCA0 


P, | Si un événement en implique un autre, sa probabilité est plus petite : 


ACB= P(A)< P(B) 


P, | La probabilité de l’union de deux événements s’obtient par la formule 
de Poincaré : 


P(AUB) = P(A)+ P(B)-P(ANB) 
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+ Cas où Q est fini 
Si Q = {«,..., w,}, la donnée de n nombres p;, 1 <i <n, associés à chacun 


des événements élémentaires par p; = P ({w;}), tels que 0 < p, < 1 et E p: = 1, 
suffit à déterminer une probabilité P sur (2, P (Q)) par : i=1 


P(A) = Ÿ{pi/o: € A} 


c’est-à-dire que la probabilité d’un événement quelconque À de P (2) est défi- 
nie comme la somme des probabilités de tous les événements élémentaires qui 
y sont inclus. 

+ Cas particulier : équiprobabilité 

Il s’agit d’un cas assez fréquent où tous les événements élémentaires ont la 
même probabilité, ce qui correspond à la loi uniforme discrète définie par : 


1 
PE; 1<i<n 
n 


Cette particularité est souvent sous-entendue ou précisée par l’affirmation 
que les résultats de l’expérience sont obtenus au hasard. On obtient alors : 
card À 


1 1 
P(A) = — = - d A = ——— 
(4) De da card Q 


&jEA 


puisque n = card @. Ce résultat s’énonce souvent sous la forme très dangereu- 
se de la règle énoncée par Laplace au XVII* siècle : 


nbre de cas favorables 


P(A) = . 
nbre de cas possibles 

un cas favorable étant un événement élémentaire qui réalise A. On est alors 
ramené à un simple problème de dénombrement. Mais il faut bien faire attention 
que cette règle ne s’applique que dans le cas d’ équiprobabilité des événements 
élémentaires. Si en jouant au loto il y a deux événements possibles, gagner ou 
non le gros lot, il n’y a malheureusement pas une chance sur deux pour l’évé- 
nement favorable qui est de le gagner ! Cette règle ne peut donc en aucun cas 
servir de définition pour une probabilité. 


—+ Attention ! C’est ici qu’il est important de bien préciser l’ensemble fon- 
damental @. Si par exemple on lance deux pièces de monnaie identiques, 
on pourrait être tenté de retenir comme ensemble fondamental 
QG ={PP,PF, FF} mais dans ce cas il n’y aurait pas équiprobabilité des 
événements élémentaires, car P P ou FF ne peut être obtenu que d’une 
seule façon alors que PF peut être obtenu de deux façons distinctes, le 
résultat pile pouvant être réalisé sur une pièce ou l’autre. Ces événements 
ont donc respectivement comme probabilité 1/4, 1/4 et 1/2. II vaut donc 
mieux faire comme si les pièces étaient distinctes et retenir 
Q—={PP, PF, FP,FF} où les événements élémentaires sont équipro- 
bables. 
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—+ Remarques 


1. Dans le cas où @ est fini, on peut toujours construire un espace proba- 
bilisé tel que chaque événement élémentaire, au sens de singleton, 
ait une probabilité nulle. Par exemple pour Q@={a,b,c} on 
choisit A = {ÿ, {a}, {b,c},Q} et la probabilité P définie par 
P({a}) = 0, P({b, c}) = 1, ce qui correspond au cas de deux événements 
indiscernables, avec un seul événement élémentaire. 


2. De même on peut construire un espace probabilisé tel que chaque évé- 
nement élémentaire, toujours au sens de singleton, ait une probabilité 
égale à 1. Dans l’ensemble précédent la probabilité P est alors définie par 
P({a} = 1 et P({b, c})) = 0. 

3. Même dans le cas où les événements À et B ne sont pas disjoints on 
peut avoir l’égalité P(A U B) = P(A) + P(B) ; il suffit pour cela que 
P(AN B) = 0. Par exemple, définissons sur @ = {a, b, c} la probabilité P 
par P({a}) = P({b}) = 1/2 et P({c}) = 0. Avec À = {a, c} et B = {b, c} 
on obtient P(A) = P(B)=1/2 et P(AUB)= P(Q)=1=1/2+1/2 
= P(A) + P(B) et pourtant AN B = {c} £ 4. 


Terminons ce paragraphe par deux exemples, paradoxaux à première vue. 


Exemple 1.13 
Dans un tournoi exhibition de tennis, Djokovic doit affronter Nadal et 
Federer au cours de trois sets successifs où ses deux adversaires alterne- 
ront. Il remportera ce tournoi s’il gagne deux sets consécutifs. Il considère 
que la probabilité p de battre Federer est supérieure à celle q de battre 
Nadal : p > q. Quel adversaire va-t-il choisir d'affronter en premier ? 
Pour une succession Fed-Nadal-Fed, sa probabilité de gain est : 

Pi = pq +(-p)qr. 


Pour une succession Nadal-Fed-Nadal, cette probabilité est : 


P2=4p+({-g)pq = pi +pq(p-q)> pi. 
Il doit donc choisir d’affronter le joueur le plus fort en premier, ce para- 


doxe s’expliquant par le fait qu’il a plus de chances de le battre une fois 
sur deux parties que sur une seule. 


Exemple 1.14 


Déterminons la répartition la plus probable de six atouts entre deux par- 
tenaires de bridge. Il y a (%) répartitions possibles des 26 cartes des deux 
joueurs. Les dénombrements des répartitions de six atouts, et donc des 
vingt non-atouts, entre les deux joueurs sont indiquées dans le tableau ci- 
après : 


(1,5) (2, 4) (3, 3) (0, 6) 
AOC CHE) CC) 26) 
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ce qui correspond aux probabilités : 


117 390 286 12 
P{(, 5)} = 805’ P{Q, 4)} = 805’ P{G, 3)} = 805” P{(0, 6)} = 305 


C’est donc la répartition (2, 4) qui est la plus probable. 


On demande maintenant de répondre à la même question dans le cas où 
les deux partenaires ont fourni aux deux premiers tours d’atout. Les 
seules répartitions initiales possibles sont alors (2, 4) et (3, 3), donnant 
respectivement les répartitions (0, 2) et (1, 1) après deux tours d’atout. Il 
reste (5) répartitions équiprobables entre les deux joueurs, les réparti- 
tions restantes des deux atouts, et donc des vingt non-atouts, ayant comme 
probabilités : 
20 
P{(0, 2)} = 20 = P{(, 1)} = 
Cheat 


(CS) _ LE 
( 21 


La répartition la plus probable à posteriori, c’est-à-dire après les deux 
tours d’atouts, est donc issue de la moins probable des deux à priori. 


robabilités conditionnelles 


On considère l’espace probabilisé (2, 4, P) et un événement particulier B de 
A tel que P(B) > 0. La connaissance de la réalisation de B modifie la probabi- 
lité de réalisation d’un événement élémentaire, puisque l’ensemble des résultats 
possibles est devenu B et non plus @2. 


Exemple 1.15 


À l'issue d'un jet de dé on sait que le résultat est supérieur à trois et on 
s'intéresse à l'événement À = « obtenir une face paire ». Initialement on 
avait P(A) = 3/6 = 1/2 ; maintenant Q est devenu Q|B = {4,5, 6} et 
P(AIB) = 2/3 > 1/2. 


Cette nouvelle probabilité, notée P(.[B), est définie sur la tribu condition- 
nelle : 
AIB = {ANB/A € A} 
ar : 
? P(ANB) 


P(AIB) = 


Seuls les événements ayant une partie commune avec B peuvent se réaliser 
et la figure 1.1 visualise cette situation où l’ensemble fondamental est devenu B 
et donc seule la part de À incluse dans B est prise en compte dans le calcul de 
la probabilité conditionnelle. 


Notion de probabilité e 13 


Figure 1.1 


Vérifions que cette application x de À dans R, définie par 
x(A) = P(ANB)/P(B) est bien une probabilité. On a bien entendu x(A) > 0 
et comme À N B C B on a également 7 (A) < 1. D’autre part : 

P(ANB)  P(B) 
P(B)  P(B) 


donc x vérifie la première condition de la définition. 


T(Q) = 


Enfin, si À, € À avec A, N À, = Ÿ pour m £ n, alors : 
# 1 # 2, P(A,NB) = 
TT A, l= ——P? A,NB)} = — = z(A, 
(U ) P(B) [U ) à P(B) > Fa 


donc la condition 2 est aussi vérifiée. 


Exemple 1.16 


On tire sans remise deux cartes successivement d’un jeu de 52 et on 
cherche la probabilité de tirer un as au deuxième coup sachant que l’on 
en a obtenu un au premier. Avec des notations évidentes : 


P(Ai4)) _@x3)}/62x51) 3 1 


(azlAi) P(A:) 4/52 ST “À 
alors que la probabilité non conditionnelle est : 
Pa = PA ED PR 7 pa 
PPT TE FRS SSSSL DNSL. 52 0 > 1 


donc valeur plus élevée (avoir tiré un as au premier coup diminue la pro- 
babilité d’en tirer un au second). 


Exemple 1.17 

On lance trois fois une pièce de monnaie et on considère les événements 
A = « obtenir au moins deux face » et B = « obtenir face au premier coup ». 
L'ensemble fondamental retenu est 8 = {P, F}, ensemble des triplets 
ordonnés, bien que l’ordre des résultats n'intervienne pas, mais pour 
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qu'il y ait équiprobabilité des événements élémentaires, soit 
P({w}) = 1/8 puisque card = —8. Ces événements s’écrivent 
A={FFP, FPF, PFF,FFF}etB={FFF, FFP, FPF, FPP}, avec 
card A— card B—4 donc P(A) = P(B)=4/8—1/2. Calculons 
maintenant la probabilité conditionnelle P(A|B). On a ANB={FFP, 
FPF,FFF} donc card AN B =3 et P(AN B) = 3/8. Ainsi : 
P(ANB) 3 1 

P(B) 4 2 
la probabilité conditionnelle a ici augmenté. 


P(A]|B) = 


La formule de définition de la probabilité conditionnelle peut aussi s’écrire, 
si P(A) > 0: 
P(ANB) = P(B)P(A|B) = P(A)P(B|A) 


et s’appelle parfois formule des probabilités composées ; elle se généralise par 
récurrence : 
P(AI NAN... NA,) =P(A;)P(AlA:)P(A3lAi N A5) 
… P(A,TAiN AN... A 1) 


n k-1 
=P(A)]] P(ai N 4) 
k=2 i=1l 
Exemple 1.18 


Dans une urne qui contient deux boules rouges et trois noires, quatre per- 
sonnes tirent successivement une boule sans la remettre ; la première qui 
tire une rouge gagne. Calculons la probabilité de gain de chaque person- 
ne A, B,Cet D: 


2 
M 


P(B) = P(N;)P(R N5=? Fee 
He ‘5 4 D, RUE 
P(C)= P(N)P(NIN)P(R;ININ:) = 5 X 4 X 3 . 5 
3 2 1 2 1 
P (D) = P(N)P(NIN)P(NININ)P(RININN 3) = HE ir 


héorème de Bayes 


Nous allons voir à partir d’un exemple dans quelles conditions on peut être 
amené à utiliser la formule, ou théorème, de Bayes. 


Exemple 1.19 


Considérons une expérience aléatoire qui se déroule en deux étapes : on 
tire au sort entre deux urnes U, et U,, avec des probabilités respectives 
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de 1/5 et 4/5 puis on tire une boule dans l’urne choisie. Leurs composi- 
tions respectives sont 6 blanches, 4 noires et 3 blanches, 7 noires. La pro- 
babilité a priori de U, est donc 1/5. Sa probabilité a posteriori, sachant 
qu'on a obtenu une boule blanche, va être plus élevée car la probabilité 
de tirer une blanche dans U, est plus forte que dans U:. 


Re P(U, NB) 
P(U1|B) = 
(U:1B) P(B) 
avec : 
P(U, NB) = P(U,)P(B|U,) = / x Re 
; = : TS "110 25 
P(B) = P(BNU,) + P(BNU;) 
= P(U;)P(BI|U:;) + P(U:)P(B|U;) 
nie. GR 5" 0 
5: 10% 107 
ainsi : 
3/25 1 1 
P(U.1B) = == = = > P(U,) = - 
(U,|B) 9/25 3 > P(U:;) 5 


Cet exemple peut se traiter par application de la formule de Bayes que nous 
allons établir en considérant un système complet d'événements, c’est-à-dire une 
partition de € en événements {A;, ..., À,} de probabilités strictement positives, 
P(A;) > 0 pour 1 <i < n, et incompatibles deux à deux, ï.e. avec A; NA; =ÿ 


pour i £ jet 2 P(A;) = 1. On suppose que les probabilités des événements 
i=1 


inclus dans chacun des À; sont connues et on va donc décomposer un événement 
quelconque B sur ce système : 


n 


s=8na=8n([a)=Uunm 
i=1 


= i=1 


On aboutit ainsi à la formule de la probabilité totale : 
P(B)=ŸY P(ANB)=YN P(A;)P(BIA;) 
i=1 i=1 


Ceci va nous permettre de calculer les probabilités a posteriori P(A;|B), 


après réalisation d’un événement B, à partir des probabilités a priori 
P(Aj,1<i<n: 


P(A;NB)  P(A;)P(B|A;)) 


FADEEES, ne 
D_P(A)P(BIA;) 
j=1 


résultat appelé formule de Bayes ou parfois théorème de Bayes. 


16 e STATISTIQUE ET PROBABILITÉS 


© Dunod. Toute reproduction non autorisée est un délit. 


Exemple 1.20 


On tire au sort entre trois urnes dont les compositions sont indiquées dans 
le tableau ci-après. Sachant qu'on a obtenu une boule rouge, on se pose la 
question de savoir quelle est la probabilité qu’elle provienne de l’urne U:. 


Rouge Bleue Verte 
U, 3 4 1 
U; 1 2 3 
U; 4 3 2 


: = 1:43: 11,4 
P(R) = BC nu) = 22 ADD EGRIE) => ( Het :) 


La probabilité a posteriori de l’urne U, étant donc : 


PCR = DPI) | 1/6 
De P(R) ” 3/8+1/6+4/9 
12: «36.2, 71 


ee D 
71-223 <23 (0) 


ndépendance en probabilité 


Définition 
Deux événements À et B sont dits indépendants, relativement à la proba- 
bilité P si : 
P(ANB) = P(A)P(B) 


La probabilité de réalisation simultanée de deux événements indépendants 
est égale au produit des probabilités que chacun de ces événements se produise 
séparément. En conséquence, si P (B) > 0: 


P(ANB)  P(A)P(B) 
P(B)  P(B) 


la réalisation d’un événement ne modifie pas la probabilité de réalisation de 
l’autre. 


P(A]|B) = 


= P(A) 


— Attention ! Ne pas confondre indépendance avec incompatibilité, car 
dans ce dernier cas AN B—=%et P(ANB)=0. 
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Exemple 1.21 


On jette un dé rouge et un dé vert et on considère les événements 
A = « le dé vert marque 6 », et B = « le dé rouge marque S ». Il nous faut 
démontrer que ces deux événements sont indépendants (bien entendu ce 
résultat est évident, il n’y a pas d'influence d’un dé sur l’autre !). 
L'ensemble fondamental retenu est Q = E x E, avec E = {1, 2, 3, 4,5, 6}, 
sur lequel il y a équiprobabilité : P({w}) — 1/67. Comme A ={6}XxE, 
B=EX{5}et ANB = {(6, 5)} on obtient : 


card À 6 1 
P (A) = = — — 

cardQ 67 6 

card B 6 1 

cardQ 67 6 

card (AN B) 1 

P(ANB)=— = — = P(A)P(B) 

card 6? 


et les événements À et B sont donc bien indépendants. 
* Indépendance mutuelle 


Si l’on considère n événements 4,, avec n > 2, il y a lieu de distinguer l’indé- 
pendance deux à deux qui impose : 


P(A;N4;) = P(4;)P(A;), 1<ix)j <n 
de l’indépendance mutuelle, condition plus forte qui s’écrit : 
P(A;,NA;,,N...1N4,) = P(A;)P(4;,)...P(A,), 2<k<n, 


pour tous les sous-ensembles {5,, ...,i,} de {1, 2, ...,n}, ce qui correspond à : 


AC GUEESE 


conditions qui doivent être réalisées. 


Exemple 1.22 


On lance deux pièces de monnaie distinctes et on s'intéresse aux événements 
À = « obtenir pile sur la pièce 1 », B = « obtenir pile sur la pièce 2 » et 
C = «obtenir pile sur une seule pièce ». À chaque pièce est attaché le 
même ensemble fondamental E = {P, F} et à l’expérience l’ensemble 
Q=EXxE. On peut écrire A={P} x E ={PP, PF} donc P(A) =2/4, 
B—Ex{P}={PP,FP} donc P(B)=2/4 et C={PF, FP} donc 
P(C)=2/4. On considère maintenant les événements deux à deux : 
ANB={PP} donc P(ANB)=1/4 = P(A)P(B), ANC = {PF} donc 
P(ANC)=1/4= P(A)P(C) et BNC ={FP} donc P(BNC) = 1/4 
— P(B)P(C), ces événements sont indépendants deux à deux. Mais 
ANBNC=Y donc P(ANBNC)=0Z P(A)P(B)P(C) et ces événe- 
ments ne sont pas indépendants dans leur ensemble. 
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À retenir 


Le modèle associé à une expérience aléatoire est arbitraire et doit être 
choisi le plus simple possible, compte tenu du problème à résoudre. Il est 
très souvent souhaitable de retenir un ensemble fondamental tel que les évé- 
nements élémentaires soient équiprobables, même si dans la réalité on ne 
peut pas les distinguer, car le calcul des probabilités est alors ramené à un 
problème de dénombrement. 


Une probabilité est une application et non pas un nombre. Il faut tou- 
jours vérifier que la somme des probabilités des événements élémentaires 
est égale à un et, dans le cas d’un nombre fini d’événements, ne pas calcu- 
ler la probabilité du dernier en retranchant à un la probabilité de tous les 
autres, car cela exclut cette vérification permettant de déceler éventuelle- 
ment une erreur dans le calcul de ces probabilités. 


L'indépendance de deux événements est définie relativement à une pro- 
babilité. L'indépendance mutuelle d’un nombre quelconque d'événements 
est une condition plus forte que l’indépendance de ces événements pris seu- 
lement deux à deux. 


La notion d’indépendance est à distinguer de celle de non-causalité, la 
condition P (A|B NC) = P (A[B) se traduisant par « C ne cause pas À ». 


Compléments : 
éléments de combinatoire 


Dans le cas particulier où il y a équiprobabilité sur un ensemble fini d'événements élé- 
mentaires, nous avons vu ($ I, C) que le calcul d’une probabilité se ramenait à un pro- 
blème de dénombrement. Ce type de problèmes est parfois très complexe et nécessite de 
connaître quelques éléments de combinatoire, permettant d’exprimer par une formule le 
nombre de configurations ayant des propriétés données. Examinons les configurations 
usuelles. 


ermutations avec répétition 


Une permutation avec répétition de r objets pris parmi n est une suite ordonnée de r 
éléments choisis parmi n, et pouvant se répéter. 
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Exemple 1.23 


Un mot de six lettres est une permutation avec répétition de six objets choisis 
parmi un ensemble, l'alphabet, de 26 éléments : coucou, habile, garage... 


Lh] {al 1b}] Li] Il} {e] 
1 2 3 4 5 6 


Une telle permutation peut être représentée par les r objets rangés dans des cases 
numérotées de 1 à r. Pour chacune de ces r cases, il y a n choix possibles de l’objet à 
ranger, donc le nombre total de ces permutations est : 


AE 
P,=n 


Exemple 1.24 


Le nombre de mots possibles de trois lettres est 26? = 17 576. 


Cela correspond au cardinal de l’ensemble fondamental associé à r tirages avec 
remise (schéma binômial) dans une urne contenant n objets distincts (ou éventuellement 
considérés comme tels de façon justement à obtenir des événements équiprobables) et 
tenant compte de l’ordre des tirages. 


C’est aussi le nombre d’applications quelconques d’un ensemble E à r éléments 
dans un ensemble F à n éléments, une application quelconque pouvant être définie 
comme un rangement de r objets dans n boîtes, chaque boîte pouvant contenir zéro, un 
ou plusieurs objets. 


E(r) F(n) 


ermutations sans répétition ou arrangements 


Une permutation sans répétition, où arrangement, de r objets pris parmi n est une suite 
ordonnée de r éléments choisis parmi n, et qui ne peuvent pas se répéter. 
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Exemple 1.25 


Le quinté est un exemple d’arrangement de cing chevaux pris parmi tous les par- 
tants de la course. 


Une telle permutation peut être représentée par les r objets rangés dans des cases 
numérotées de 1 à r. Pour la première case il y a n choix possibles, pour la deuxième il 
n’y en a plus que ñn—1, et pour la r-ème il n’en reste plus que 7 —-r + 1 ; le nombre d’ar- 
rangements est donc : “il 
A =n(n-1l)...(n-r +1) = —— 

(nr)! 

Cela correspond au cardinal de l’ensemble fondamental associé à r tirages sans remi- 
se (schéma hypergéométrique) dans une urne contenant n objets distincts et tenant comp- 
te de l’ordre des tirages. 


C’est aussi le nombre d’applications injectives d’un ensemble E à r éléments dans 
un ensemble F à n éléments, une application injective pouvant être définie comme un 
rangement de r objets dans n boîtes, chaque boîte ne pouvant contenir que zéro ou un 
objet. Il faut bien sûr que n = cardF > cardE =r. 


Exemple 1.26 
Le nombre de tiercés dans l’ordre avec quinze partants est : 
A = 15 x 14 x 13. = 2730 


Permutation : il s’agit du cas particulier n = r. 


Une permutation est donc une suite ordonnée de n objets distincts ; le nombre de per- 
mutations est : 


n 
P,=A"=n! 


Exemple 1.27 


Le classement de cinq candidats à une épreuve forme une permutation, il y en a 
5! = 120. 


C’est aussi le nombre de bijections d’un ensemble E à n éléments dans un ensemble F 
à n éléments. 


ermutations avec répétition de n objets, 
dont k seulement sont distincts 


Il s’agit d’une suite ordonnée de n objets choisis dans k classes distinctes, le nombre 
d’objets de la classe à étant n;, 1 <i < k, avec bien sûr n1 +...+nx = n. Prenons 
l'exemple de n boules numérotées, extraites sans remise d’une urne, et de k couleurs dis- 
tinctes. Il y a n! tirages ordonnés possibles ; mais si on efface les numéros des n, boules 
rouges par exemple, les n,! permutations de ces boules conduisent à la même permuta- 
tion, donc le nombre de permutations distinctes devient n!/n,! Il en est bien sûr de même 
pour toutes les autres couleurs et par conséquent le nombre de permutations est : 


n! 


ni!...nx! 
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Exemple 1.28 


Cherchons le nombre de mots différents formés avec les lettres du mot barbare. Il 
y a sept lettres, mais seulement quatre catégories distinctes, soit un nombre de 


mots distincts égal à : 71 
— = 630 
2121211! 
C’est aussi le nombre de partitions de n objets en k classes d’effectifs n;,1 <i <k, 
fixés. Dans le cas particulier où il n’y a que deux classes, on obtient le coefficient binô- 
mial (de ) qui représente le nombre de sous-ensembles à n, éléments que l’on peut ex- 


traire d’un ensemble à n éléments. 


ombinaisons (sans répétition) 


Une combinaison est un sous-ensemble non ordonné de 7 objets choisis dans un 
ensemble qui en contient n. Ces sous-ensembles sont au nombre de : 


n\_ À, n! 
U TR En 
Exemple 1.29 


Le nombre de tiercés dans le désordre avec quinze chevaux au départ est : 
(YA 


Le sous-ensemble choisi définit bien sûr le sous-ensemble restant et donc : 


Exemple 1.30 


On joue au poker d’as avec quatre dés identiques et on souhaite calculer la pro- 
babilité des différents résultats possibles. Bien que les dés ne soient pas distincts, 
nous retenons comme ensemble fondamental S = E*, où E = {1, 2, 3,4, 5,6} 
est l’ensemble des résultats associés à un dé particulier ; ainsi tous les événe- 
ments élémentaires sont équiprobables et ont même probabilité 1/6*. En effet, un 
résultat est une permutation de quatre objets choisis parmi six. Un carré est un 


résultat de la forme (aaaa) avec six choix possibles pour la hauteur : 
' 1 
P(carré) = pas = ë 
Un brelan est un résultat de la forme (aaab) avec six choix pour la hauteur a, 
cinq choix pour b et quatre places possibles, soit : 


6x5x4 20 
7 6 6 
Une double paire est un résultat de la forme (aabb) avec (S) choix possibles pour 


les paires et une permutation de quatre objets dont deux seulement sont distincts, 


-, 4! : 
soit 301 et : 


P (brelan) = 


15 
P (double paire) = ë 
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Une paire est un résultat de la forme (aabc) avec six choix possibles pour la hau- 
teur, G) choix possibles pour les hauteurs qui l’accompagnent et un nombre de 
l 


permutations de quatre objets dont trois distincts TFTTEN soit : 
120 
P (paire) = e 
Le nombre de résultats quelconques (abcd) est le nombre de permutations sans 
répétition de quatre objets pris parmi six, d’où : 
6x5x4x3 60 
6! 5 = 


216 
On vérifie bien que la somme des probabilités est égale à 8e = 1. 


Tous les sous-ensembles que l’on peut extraire d’un ensemble E à n éléments peu- 
vent contenir O, 1,..., n éléments, d’où la relation : 


card P(E) = 2" = Fe de (1) SN (n) 
0 1 n 


Enfin, parmi les sous-ensembles à r éléments, il y a ceux qui contiennent un objet 

: À =] : R 1 & 

articulier, en nombre (7. }), et ceux qui ne le contiennent pas, en nombre ("= }, d’où 
r-1l r 


la relation : 
mie 
= + 
r r—1 r 


qui permet de construire le triangle de Pascal. 


P (quelconque) = 


E. Combinaisons avec répétition 


Une combinaison avec répétition est un sous-ensemble non ordonné de r objets choisis 
dans un ensemble qui en contient n et qui peuvent se répéter. 


b- Exemple 1.31 


Les r objets tirés avec remise dans une urne qui en contient n distincts forment 
une combinaison avec répétition puisque seule compte la nature des objets tirés, 
indépendamment de l’ordre des tirages. 


Une telle combinaison sera représentée sous la forme (x1, ..., x,) Où x, 1 <i <n, 
représentera le nombre d’objets i appartenant au sous-ensemble, avec bien sûr x; > 0 et 
Xi +...+2x, = r. Elle peut être symbolisée par une suite formée d’objets O et de sépa- 
rateurs / avec x, objets (© avant le premier séparateur, x2 objets entre le premier et le 
deuxième /..., x, objets © après le (n —1)-ème /. Elle est donc caractérisée par la place 
des r objets © dans la suite des r + n—1 symboles. 


1 2 3 n-2 n-1 
o0/000//] oise loloo 
e. Le 4 . 
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Par exemple, la combinaison constituée de deux objets de la catégorie 1, d’un objet de 
la catégorie 3 et de trois objets de la catégorie 4 s’écrit (2, 0, 1, 3) ou2+0+1+3—=6 
représentée sous la forme symbolique : © © // O / O OO. Réciproquement, la suite 
de symboles / O /O OO / OO représente une combinaison d’un objet de la catégo- 
rie 2, de trois objets de la catégorie 3 et de deux objets de la catégorie 4. Il y a donc une 
bijection entre une combinaison et une telle suite, et le nombre de combinaisons avec 
répétition est donc égal au nombre de rangements des r objets ©) (ou des n —1 sépara- 
teurs /) dans les r + n—1 cases, soit : 


€ = bre 
r 


artitions 


Le nombre de partitions de n objets en r classes d’effectifs non fixés est appelé nombre 
de Stirling de deuxième espèce et se calcule à partir de la récurrence : 


1 _ ger-1 12 
nu Sn trs, l<r<n 


avec bien sûr S! = 1 et $? —2"-!-1. Les partitions de n + 1 objets en r classes se 
décomposent en effet en celles où le (n + 1)-ème objet constitue une classe à lui tout 
seul, il y en a S”-!, et celles où on l’intègre à une classe déjà formée, il y en a rS”. 


Une surjection d’un ensemble E à n éléments dans un ensemble F à r éléments cor- 
respond à un rangement de n objets dans r boîtes dont aucune n’est vide, c’est-à-dire à 
une partition de ces n objets en r classes, où l’ordre des classes intervient. À une parti- 
tion donnée correspondent r! surjections distinctes, donc le nombre total de surjections 
est r!S7. 


Le nombre de partitions de n objets distincts en k classes dont n; ont le même effec- 
tifj, 1 < j LKk, (avec bien sûr se jn;j =n)est: 


n! 
AD 292... KDE nil... ne! 
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Exercices 


noncés 


Exercice n°1 


Une machine fabrique des objets qui sont classés en défectueux, codés 0, et non défec- 
tueux, codés 1. On prélève toutes les heures les trois derniers objets produits par cette 
machine. On demande de préciser l’ensemble fondamental associé à cette expérience et 
d'écrire les événements suivants : À = « le premier objet est défectueux » ; B —« le der- 
nier objet est non défectueux » ; € —« les premier et dernier objets sont défectueux » ; 
D =« aucun objet n’est défectueux » ; £ =« deux objets sont défectueux » ; F =« au 
plus un objet est défectueux ». 


Exercice n°2 

Soit 8 —{a,b,c} et considérons les ensembles À; — {ÿ, {a}, {b, c}, } et 
À = {Ÿ, {b}, {a, c}, @}. Montrer que ce sont des tribus sur ©. Les ensembles 4; N 4; 
et À; U 4 sont-ils des tribus sur & ? 

Exercice n°3 


Soit 8 = N et À la famille des parties À de Q telles que À est fini ou bien À est fini. 
Montrer que À est une algèbre mais pas une o-algèbre. On pourra considérer les 
ensembles À, = {2n},ne N. 

Exercice n°4 


On effectue deux tirages successifs dans une urne qui contient une boule blanche et deux 
boules noires identiques. La première boule tirée n'est pas remise dans l'urne, mais est 
remplacée par une boule de l'autre couleur (blanche si on a tiré une noire et vice-versa). 


1) Construire l'ensemble fondamental {2 associé à cette expérience aléatoire, en tenant 
compte de l'ordre des tirages. 


2) Montrer que l'ensemble des parties de © défini par : 
AZ {BA(NN)}{(BN) ,(NB)},Q} 


est une tribu. La notation (BN) représente par exemple l'événement élémentaire « tirer 
une boule blanche, puis une noire » . 


3) Déterminer la probabilité de chacun des événements élémentaires constituant ©2. 


Exercice n°5 


On lance un dé quatre fois de suite et le joueur À marque 1 point si le chiffre obtenu est 1 
ou 2 ; sinon c'est le joueur B qui marque un point. Le joueur qui gagne la partie est celui 
qui a le plus de points à l'issue de ces quatre lancers. Calculer la probabilité de gain de 
chaque joueur, en précisant l'ensemble fondamental © retenu pour modéliser ce problème. 


Exercice n°6 


Une urne contient une boule blanche et une boule noire. On effectue des tirages avec 
remise dans cette urne jusqu’à obtenir une boule blanche, ajoutant une boule noire après 
chaque tirage d’une boule noire. Calculer la probabilité d’effectuer n tirages, n € N*. 
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Exercice n°7 


Un laboratoire a mis au point un test rapide de dépistage du VIH (responsable du SIDA) 
mais qui n’est pas totalement fiable. Il est positif avec une probabilité de 0,99 si le patient 
est effectivement atteint et avec une probabilité de 0,01 si le patient n’est pas atteint. On 
tire au hasard un individu dans une population où 4% sont porteurs du VIH. Calculer la 
probabilité qu’il ne soit pas atteint sachant que le test a été positif. 


Exercice n°8 


Le professeur Tournesol cherche ses gants qu’il pense avoir rangés avec une probabilité 
p dans sa commode. Si c’est le cas, il les a mis au hasard dans l’un des 4 tiroirs. Sachant 
qu’il ne les a pas trouvés dans les 3 premiers, calculer la probabilité qu’ils soient dans le 
quatrième. 


Exercice n°9 


On effectue deux tirages successifs avec remise dans une première urne qui contient 
autant de boules noires que de boules blanches. On place ensuite dans une seconde urne 
vide deux boules de la même couleur que celles qui ont été tirées. 


1) Indiquer les différentes compositions possibles de cette urne et la probabilité associée. 


2) On effectue ensuite des tirages successifs avec remise dans cette seconde urne. On 
note p, la probabilité que cette urne contienne deux boules blanches, sachant que l’on n’a 
obtenu que des boules blanches au cours des n premiers tirages. Calculer p1, pr, puis Pa 
pour n > 2 et ensuite la limite de p, quand n devient infini. Cette limite était-elle prévi- 
sible ? 


Exercice n°10 


On jette ensemble cinq dés identiques et à chaque coup on enlève les as (chiffre 1) qui 
sont sortis avant de relancer les autres dés. Quelle est la probabilité d’obtenir un poker 
d’as, c’est-à-dire cinq as, en trois coups au plus ? 


Exercice n°11 


Un document contient quatre erreurs et à chaque relecture la probabilité de détection 
d’une erreur ayant subsisté est de 1/3. Quelle est la probabilité p, qu’il ne subsiste aucune 
faute après n relectures, n € N* ? 


Exercice n°12 


Un étudiant doit répondre à un questionnaire à choix multiple où cinq réponses sont pro- 
posées à une question, une seule étant correcte. Quand l’événement À = « l’étudiant a 
bien travaillé dans l’année » est réalisé, la réponse est fournie avec exactitude. Dans le 
cas contraire, l’étudiant répond au hasard. Si l’événement B =« il a fourni la réponse 
correcte » est réalisé, calculer la probabilité P(A|B) en fonction de p — P(A). 


Exercice n°13 


Dans la rue principale de Champignac, chacun des deux feux de circulation successifs est 
vert les deux tiers du temps. Si vous roulez à la vitesse réglementaire de 50 km/h, après 
avoir franchi le premier feu au vert, vous trouverez le second au vert trois fois sur quatre. 
Si vous grillez le premier feu au rouge, calculez la probabilité que le second soit aussi au 
rouge si vous roulez toujours à la vitesse réglementaire de 50 km/h, en précisant l’en- 
semble fondamental retenu pour ce problème. 
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Exercice n°14 


Deux joueurs de tennis s’entraînent au service, le joueur À servant une fois sur trois et le 
joueur B deux fois sur trois. Leurs pourcentages de réussite au service sont respective- 
ment de 90 % et de 60 %. 


1) Si vous assistez à un service réussi au cours de cet entraînement, quelle est la proba- 
bilité p# qu’il s’agisse du joueur B ? 


2) Calculer cette probabilité p, en fonction du pourcentage p de réussite du joueur B. 
Pour quelle valeur de p} cette probabilité est-elle égale à 1/2 ? 


3) Que vaut p3 dans le cas où les joueurs À et B ont le même pourcentage de réussite au 
service ? Le résultat était-il prévisible ? 


Exercice n°15 


Soit = {a, b, c, d} avec équiprobabilité des événements élémentaires sur P (2). Les 
événements À = {a, b},B = {a, c} et C = {a, d} sont-ils indépendants ? 


Exercice n°16 


Les événements À et B étant indépendants, montrer que les événements À et B ainsi que 
A et B sont aussi indépendants. Si l’événement C est indépendant de A et de B, est-il 
aussi indépendant de À U B ? L’événement C est-il indépendant de À N B ? 


Exercice n°17 


On effectue trois lancers successifs d’une pièce de monnaie. Les événements 
A={FFF, PFF, FPP, PPP}, B={FFP, FPP, PPF, PPP} et C={FFP, 
FPF, PFP, PPP} sont-ils indépendants ? 


Exercice n°18 


Problème de rencontres. Lors d’un bal auquel participent n couples, le choix de sa cava- 
lière pour la première danse se fait au hasard. La probabilité de danser avec sa femme est 
donc 1/n, valeur faible si n est grand. Cependant, on demande de montrer que la proba- 
bilité qu’il y ait au moins une rencontre entre un danseur et sa femme est supérieure à la 
probabilité qu’il n’y en ait pas. 


Exercice n°19 


Avant le tirage au sort des quarts de finale de la Ligue des Champions de football il reste 
4 équipes anglaises. Calculer la probabilité p qu'il y ait au moins un quart de finale qui 
oppose 2 équipes anglaises. 


Lorrigés 


Exercice n°1 


On choisit comme ensemble fondamental @ = {0, 1}°, c’est-à-dire l’ensemble des tri- 
plets ordonnés, bien que l’ordre soit sans importance, car cela permet d’obtenir des évé- 
nements élémentaires équiprobables et facilite donc le calcul ultérieur des probabilités. 
Les événements indiqués s’écrivent alors: À = {0} x {0, 1}, B = {0, 1} x {1}, 
C = {0} x {0, 1} x {0} = {(000), (010)}, D={(111)}, ÆE = {(001), (010), (100)}, 
F ={(111), (110), (101), (011)}. 
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Exercice n°2 


Si on note A, —={a} et A2—{b}, les deux ensembles considérés s’écrivent 
À; = {W, Ai, À;, Q}, avec i = 1,2, et sont donc des tribus sur Q. L'ensemble 
A1 N À = {9, Q} est la tribu grossière et À; U À, = {ÿ, {a}, {b}, {a, c}, {b, c}, Q} 
n’est pas une tribu car {a, c}N{b, c} = {c} é A1 U A. 


Exercice n°3 


La famille À est non vide puisqu’elle contient par exemple les ensembles A,. Par défi- 
nition, elle est fermée pour le passage au complémentaire. Si deux éléments À et B de 
la famille sont finis alors À U B l’est aussi ; si l’un des deux n’est pas fini alors À U B 
n’est pas fini mais son complémentaire l’est, comme intersection de deux ensembles dont 
l’un est fini. Ainsi dans les deux cas À U B appartient à À qui est aussi fermée pour 
l’union donc est une algèbre. 


Mais l’union dénombrable U,enA, = 2N est l’ensemble des entiers pairs qui n’est pas 
fini. Son complémentaire est l’ensemble des entiers impairs, qui n’est pas fini non plus, 
et donc cet ensemble n’appartient pas à la famille À. Il n’y a pas fermeture pour l’union 
dénombrable donc cette algèbre n’est pas une o-algèbre. 


Exercice n°4 


1) L'ensemble fondamental est constitué de tous les événements élémentaires possibles, 
écrits sous la forme de couples dont la première lettre désigne la couleur de la première 
boule tirée et la seconde la couleur de la boule extraite ensuite. Si la première boule tirée 
est blanche, l'urne ne contient plus que des boules noires et le seul événement possible 
est donc représenté par le couple ordonné (BN). Si la première boule tirée est noire, la 
composition de l'urne est {B,B,N} et il y a alors deux événements possibles, (NB) et 
(NN). On a donc : 


Q ={(BN),(NB) ,(NN)} 


2) L'ensemble À est un ensemble non vide de parties de 2 qui peut s'écrire 
A = {ÿ,A,A,8} en ayant posé À = (NN). Il est facile de voir qu'il est fermé pour 
l'union et le passage au complémentaire, donc est une algèbre. Comme À comporte un 
nombre fini d'éléments cette algèbre est aussi une o-algèbre, ou tribu. 


3) D'après la question 1 : 


P(BN)= 3x1 P (NB) = 


SI D 
Sd] D 
SI D 
SI 


x P(NN)j=-x 


Exercice n°5 

Si on note À l'événement « le joueur À a marqué un point », l'ensemble fondamental est : 
a ={42} 

Il n'y a pas équiprobabilité ici car P (A) = £ et P (A) = è. Pour que le joueur À gagne, 


il faut qu'il marque 3 ou 4 points et il en est de même pour le joueur B. Les probabilités 
de gain de chaque joueur sont donc : 


P(AG) = 4 . D) = 
Lee Die G + (2 7 9 


ES = 4(7) 5 2) -X 
OR É +6 = 27 
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La somme de ces probabilités n'est pas égale à 1 car les joueurs peuvent marquer 2 points 
chacun et être ex-aequo : 


ren-() 0) CE) -3 


Effectuer n tirages correspond à l’événement, noté B,, « obtenir une boule blanche au 
n-ème tirage et des boules noires à tous les tirages précédents ». Nous obtenons ainsi : 


Exercice n°6 


P(B:) = 


Dir Dir 


P(B:) = 


n-1 1 1 
X —) 
n n +1 n(n +1) 


2 
X — X...X 
3 


Exercice n°7 
En notant T* « le test est positif » et À « le patient est atteint », les hypothèses se tra- 
duisent par P(T*|A) = 0,99 et P(T*|A) = 0,01. La probabilité demandée est : 


PANT*) 0,96 x 0,01 8 


P(AIT*+) = = _ 
GE P(T+) 0,04 x 0,99 + 0,96 x 0,01 41 


Exercice n°8 


On note C l'événement « les gants sont rangés dans la commode », 4 « ils sont dans le 
tiroir 4 » et 3 « ils ne sont pas dans les 3 premiers tiroirs ». La probabilité cherchée s’écrit 
P(4/3) et se calcule par la formule de Bayes. Comme P(3|C) = 1/4 et P(3|C) = 1 on 
obtient : 


PAN3) PA) pA4  _ p 


P(4/3) = ri = 
P(G3) PG) pl4+l-p  4—3p 


Exercice n°9 


1) L'ensemble fondamental associé à ces deux tirages indépendants est Q = {B,N}°. 
Il y a 3 compositions possibles de cette urne avec P(BB) = P(NN)=1/4 et 
P(BN) = 2/4. 

2) On utilise la formule de Bayes pour calculer p, = P(BB]|B:;), avec P(B;|BB) = 1, 
P(B:INN) =0 et P(B;INB) = 1/2 ; ainsi p, = 1/2. On obtient de la même façon 
p2 = 2/3 puis pour n >2: 


: P(BB) " 1 
7 P(BB)+P(B;...B,IBN)/2 1+1/21 


Pa 


Quand n devient infini p, — 1, résultat prévisible car si on ne tire que des boules 
blanches, c’est sans doute qu’il n’y a pas de boule d’une autre couleur dans l’urne. 
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Exercice n°10 


Soit N;, 1 <i <5, le nombre de jets nécessaires pour obtenir un as avec le dé i. Le 
poker d’as est obtenu en moins de trois coups si max{N;/1 < i < 5} < 3, événement qui 
est équivalent à : 


PM < 3) 


i=1 


Tous ces événements sont indépendants et ont la même probabilité : 


3 3 5 k-1] 5 3 
Pa <D= XP =p=) (à) == (à) 


La probabilité demandée est donc : 
5 
5\5 
1—|- = 0,013 
(7 


Pour qu’une faute ne soit pas corrigée il faut qu’elle ait subsisté à chaque relecture, ce 
qui se produit avec une probabilité (2/3)" ; pour chaque faute la probabilité d’être corri- 
gée est donc 1-(2/3)" et la probabilité de correction des quatre erreurs est par consé- 


quent : 
à n-4 
n — 1- | - 
- | (3) 


Bien sûr p, tend vers un quand n devient infini, avec p4 = 0,41; p6 = 0,69; pg = 0,85 
et Pio = 0,93. 


Exercice n°11 


Exercice n°12 
Il suffit d’appliquer la formule de Bayes : 


P(ANB) P(A)P(B]A) P 5p 


P(A|B) = = + _— = 
(218 P(B) P(A)P(B|A)+ P(A)P(B|A) p+(i-p)/5 4p+l 


On peut noter que P (A|B) > P (A) = p, avec bien sûr P (AB) =0 si p =0 et 
P (AÏB) = 1 sip = 1. Dans tous les autres cas P (A|B) > P (A). 
Exercice n°13 


L'ensemble fondamental est constitué des couples ordonnés dont les éléments symboli- 
sent la couleur des premier et second feux : 


Q={ViV,,ViR,RiV,RiR} 


Nous noterons : 
Pi= PV)  pra= P(ViR) ps = P(RiV) pa = P(RiR) 
Les hypothèses se traduisent par : 
PV) =pitp= PV) = pit ps =2/3 
P(V21V1) = 3/4 
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On en déduit : 


1 
pi = PV) = P(VDP(VIV) = 5 


puis p2 = p3 = 1/6 et donc p4 = 1/6. 
On peut alors calculer : 
P(RiR) _ 1 


P(R]R:) — PR). — 2 
1 


Exercice n°14 
1) Si on note R l’événement « réussir son service », on obtient : 


P(BNR)_  2%x0,6 4 
P(R)  0,9+2x0,6 7 


ps = P(BIR) = 


2) On obtient cette fois : 
Li 28 
PB 59 +2p 
avec pg = 1/2 pour p = 0,45. 


3) Si les joueurs ont le même taux de réussite : 


Exercice n°15 

En raison de l’équiprobabilité : 

P(A) = P(B) = P(C) = 1/2 et P(AN B) = P({a})= 1/4 = P(A)P(B), 

P(ANC) = P({a}) = 1/4 = P(A)P(C) et P(BNC) = P({a}) =1/4= P(B)P(C) 
donc les événements À, B et C sont indépendants deux à deux. Par contre : 


1 
P(ANBNC) = P({a}) = à Æ P(A)P(B)P(C) 
et ils ne sont pas mutuellement indépendants. 


Exercice n°16 
On obtient : 
P(ANB)= P(A)-P(ANB) = P(A)-P(A)P(B) 
= P(A)[1-P(B)] = P(A)P(B) 


donc les événements À et B sont indépendants. De même : 


P(ANB)= P(B)-P(ANB) = P(B)-P(A)P(B) 
= P(B)[1-P(4)] = P(A)P(B) 


donc À et B sont aussi indépendants. 
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On peut écrire : 


P{(AUB)NC}= P(ANC)+P(ANBNC) 
= P(ANC)+P(BNC)-P(ANBNC) 
= [P(A)+ P(B)]P(C)-P(AN BNC) 
= P(AUB)P(C)+ P(ANB)P(C)-P(ANBNC) 


donc pour qu’il y ait indépendance de C avec AUB ïl faudrait que 
P(A)P(B)P(C) = P(ANBNC), c’est-à-dire que A, B et C soient mutuellement 
indépendants, ce qui n’est pas le cas en général. Dans l’exercice précédent on a d’ailleurs 
P(AU B) = P({a, b, c}) = 3/4 avec P {(AU B)NC}= P({a}) = 1/4 Z£ P(AUB) 
P(C) = 3/8 ce qui montre que À U B n’est pas indépendant de C. De même, d’après ce 
qui précède, pour que C soit indépendant de À N B, il faut que C soit aussi indépendant 
de À NB, ce qui n’est pas le cas en général comme le montre également l’exercice pré- 
cédent puisque P(ANB)=1/4 et P(C)=1/2 avec P(ANBNC)=1/4 
£ P(ANB)P(C). 


Exercice n°17 

On obtient P(AN B) = P({FPP,PPP}) =1/4= P(A)P(B),P(BNC)=P({FFP, 
PPP})=1/4= P(B)P(C) et P(ANC) = P({PPP} = 1/8 £ P(A)P(C) donc ces 
événements ne sont pas indépendants deux à deux et a fortiori ne sont pas mutuellement 
indépendants, bien qu'ici P(AN BNC) = P({PPP}) =1/8 = P(A)P(B)P(C). 


Exercice n°18 


Notons par À; l’événement « le danseur à se retrouve avec sa femme ». L'événement « il 
y a au moins une rencontre » est donc U*_, A;. Sa probabilité s’obtient à partir de la for- 
mule de Poincaré (cf. I, C) pour ñn événements : 


re r(Ua) = De S  P(AyN...NA;) 


i=1 {i1, …, ix}C{I, …, n} 


Si chaque danseur est représenté par une case numérotée de 1 à n, l’événement 
Ai, N...1N A;, correspond à une permutation où les femmes de ces danseurs sont pla- 


cées dans les cases 51, ..., i,. Comme toutes les permutations sont équiprobables : 
n-k)! 
P(AN... NA) = —— 
n! 
Par ailleurs, le nombre de sous-ensembles {i1, ..., i,} extraits de {1, ..., n} est égal à 
(4), donc : 
n\(n-k)! 1 
_: Pan n An) = (R) RE = 
{ü, …, WJC{L nn} 
et : n (pt 
QE k 
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La probabilité qu’il y n’ait aucune une rencontre est donc : 


: : n D n (1 1 
Q=l-pr=1-) 7 — =) -=03678. 


k=1 k=0 


On obtient bien des valeurs plus petites que 1/2, sauf g> = 0,5. Les autres valeurs sont : 


1 3 
= — —0,3333; = — = 0,375; 
3 3 da 8 


Exercice n°19 


Il y a équiprobabilité de tous les quarts de finale qui sont au nombre de : 
8! 


—— = 105 
(21*4! 


car il s'agit du nombre de partitions de 8 équipes distincts en 4 matchs de même effectif 
2 (cf. Compléments F). 
Pour chaque équipe anglaise, le nombre d'associations possibles avec une équipe non 
anglaise est successivement 4, puis 3, puis 2, puis 1. Il y a donc 4! = 24 quarts de fina- 
le qui ne comportent pas de match entre équipes anglaises. On obtient donc : 

24 81 


ja L 
F Pa 105 — 105 


On peut calculer la probabilité des autres événements élémentaires. Deux quarts de fina- 
le entre équipes anglaises correspondent à 2 partitions de 2 sous-groupes de 4 (équipes 
anglaises et non anglaises ) en matchs de même effectif 2, soit un nombre de possibilités : 


4! 4! 
D Re 
12! (2172! 


La probabilité de deux quarts de finale entre équipes anglaises est donc : 
_ 9 
7 105 


Enfin, il y a (5) choix de matchs entre 2 équipes anglaises et (5) choix de matchs entre 


P2 


2 équipes non anglaises. Il ne reste ensuite que 2 façons de choisir les 2 autres quarts de 
finale en associant une des 2 équipes anglaises restantes à une des 2 équipes non 
anglaises restantes. Cela correspond au nombre de quarts de finale : 


2(2)()-7 


La probabilité d'un seul match entre équipes anglaises est donc : 


72 


TT 


On retouve bien p = p;1 + p2. 
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ariable aléatoire 


e besoin de calculs, comme par exemple celui de la moyenne asso- 

ciée aux différents résultats possibles d'une épreuve aléatoire, 

impose que ce résultat, symbolisé ou non par un nombre, soit mis 
sous forme numérique. C'est pourquoi on souhaitera presque toujours 
traduire par une valeur numérique l'événement réalisé. Pour un lancer 
de pièce de monnaie, on peut retenir par exemple comme codage des 
résultats : pile > 0, face > 1. Pour un lancer de dé, il y a un codage 
naturel puisque le résultat a ici un caractère numérique : 
face 1 1,..., face 6+ 6; mais on peut bien sûr envisager d'autres 
codages, comme par exemple noter par zéro tout résultat pair et par un 
tout résultat impair, d'où les nouvelles associations: face 1 + 1, 
face 2+ 0,...,face6+ 0. 
Bien entendu la valeur numérique associée à un résultat est arbitraire et 
correspond à un codage des événements qui va se faire au moyen d'une 
certaine application, notée usuellement X, qui va associer un nombre à 
chaque événement élémentaire, soit : 


X:Q—RkR 


Le résultat w ayant un caractère aléatoire, la valeur numérique X(w) 
associée a aussi un caractère aléatoire. || serait donc intéressant de pour- 
voir calculer la probabilité que X prenne une certaine valeur ou appar- 
tienne à un certain intervalle. Pour pouvoir définir cette probabilité sur 
l'ensemble image &' = X(Q) CR, il faut pouvoir revenir en arrière sur 
l'ensemble de départ puisque la probabilité est définie sur (2,4). Il va 
donc falloir imposer une certaine condition à cette application qui sera 
alors appelée variable aléatoire (v.a., random variable) si elle est réalisée. 
Cette terminologie est d'ailleurs assez maladroïte puisque cette variable 
est en l'occurrence une fonction ! 

Considérons l'exemple suivant où l'ensemble fondamental est 
Q — {a,b,c,d}. La partition I = {{a},{b},{c,d}} engendre l'algèbre 
À = {ÿ,{a},{b},{c,d},{a,b},{a,c,d},{b,c,d},{}. Les événements c et d 
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étant supposés indiscernables, on définit une probabilité P par 
P({a}) = 1/4,P({b}) = 1/2 et P({c,d}) —1/4. On définit alors une 
application X : Q — R par X(a) = X(d) = 1 et X(b) = X(c) = 0. La 
probabilité que X prenne la valeur 0 est la probabilité de {b,c} qui n'est 
pas un élément de 4, donc n'est pas un événement, et par conséquent 
on ne peut pas calculer cette probabilité. Cette application n'est donc pas 
une V.a. 

Pour la facilité de l'exposé, il sera utile de distinguer le cas où X(Q) est 
dénombrable, la v.a. X étant alors dite discrète, de celui où X(S2) est un 
ensemble non dénombrable de R (généralement un intervalle, pouvant 
être R tout entier, ou une réunion d'intervalles), la v.a. étant dite conti- 
nue. La loi de probabilité d'une v.a., qui peut toujours être définie par sa 
fonction de répartition, le sera plutôt par les probabilités individuelles 
dans le cas discret et par la densité dans le cas continu. Nous définirons 
les deux caractéristiques numériques principales d'une distribution, l'es- 
pérance, caractéristique de valeur centrale, et la variance, caractéristique 
de dispersion. 


Objectif du chapitre : retenir que dans les cas usuels la loi d'une variable 
aléatoire est déterminée par les probabilités des points dans le 
cas discret, par la densité dans le cas continu, et que cette loi est 
souvent caractérisée par les deux premiers moments qui sont 
l'espérance, caractéristique de valeur centrale, et la variance, 
caractéristique de dispersion autour de cette valeur centrale. 

Concepts clés étudiés : variable aléatoire, fonction de répartition, densité 
de probabilité, espérance mathématique, variance, écart type. 


ariable aléatoire réelle discrète 


éfinition 


On appelle v.a. discrète définie sur ($2,.4) une application X : (@ — R telle que 
X(@) est dénombrable (en général X (2) est fini ou X(Q) C N ou X(Q) CZ 
et dans tous les cas X (2) est en correspondance bijective avec N) et telle que 
pour tout x réel : 


X-!(x) = {we R/X(w) = x} € À 


ce qui exprime tout simplement que X-!(x) est un événement. 
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— Remarque 


Si A — P(Q), toute application X sera une v.a. puisque X_!(x) € P(Q) 
pour tout x réel. 


oi de probabilité 


La propriété résultant de la définition d'une v.a. va nous permettre de définir la 
probabilité de chacune de ses valeurs possibles x € X(G2) par : 


Px(X = x) = P{X-(x)} = P {wo € Q/X(w) = x} 


Exemple 2.1 

Si on associe la valeur 1 au résultat impair d'un jet de dé: 
X7!(1) = {1,3,5}, la probabilité de la valeur 1 sera P({1,3,5}) = 1/6 
+1/6+ 1/6 = 1/2. 


Cette nouvelle probabilité, définie cette fois sur 2’ = X($2) et notée Py, s'ap- 
pelle la probabilité image de P par X. La relation précédente peut s'écrire sché- 
matiquement Px(x) = (P o X-')(x). Nous allons vérifier que P; est bien une 
probabilité définie sur 2’. Tout d'abord, l'ensemble d'arrivée de cette application 
est celui de P, donc [0,1]. D'autre part : 


Px(R) = P [X"1(Q)} = PQ) = 1; 
enfin, si A, C Q’, avec À, N À, = Ÿ pour m £ n: 


(Ua) = E(Ü4)| = [ral _ SP {X7'(4,)} 


n=0 n=0 n=0 n=0 


= SPA) 


n=0 


Très souvent dans la suite, par souci de simplification mais par abus de nota- 
tion, nous noterons P les probabilités images Px. 


L'ensemble ©’ = X(62) étant dénombrable, il existe une bijection permet- 
tant de représenter ses éléments par l'ensemble des x;,i € N. La loi de probabi- 
lité P, de X est alors définie par les probabilités individuelles : 


pi = Px(X = x) = P{X (x)}, ieN 


On appelle alors distribution ou loi de probabilité de la v.a. X l'ensemble des 
couples (x;,p:);.N. Si À ne prend qu'un petit nombre de valeurs, cette distribu- 
tion est généralement présentée dans un tableau. 
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Exemple 2.2 


La loi uniforme associée à un lancer de dé à six faces numérotées est pré- 
sentée dans le tableau ci-après : 


x; 1 2 3 4 5 6 
Pi | 1/6 | 1/6 | 1/6 | 1/6 | 1/6 | 1/6 1 


+ Cas particuliers 
Variable certaine 


Il s'agit d'une v.a. qui est constante, i.e. qui prend la même valeur connue a quel 
que soit le résultat de l'épreuve : 


P;(X=a)=1 


La masse totale de probabilité est concentrée en a ; on parle de loi de Dirac 
associée à cette variable certaine. 


Variable indicatrice 


Soit À € À un événement quelconque ; on appelle v.a. indicatrice de cet évé- 
nement À, la v.a. définie par : 


_ [I si weA 
x@)= |, si oEAÀ 


et notée X = 1,. Ainsi : 


P;(X = 1) = P {w/w € A} = P(À) 
Px (X = 0) = P {w/w € A} = P(A) = 1 — P(A) 


onction de répartition 


On appelle fonction de répartition de la v.a. X, la fonction F définie pour x réel 
par : 


F(x) = Px{X < x} = P{w e Q/X(w) < x} 


Il faut noter que beaucoup d'ouvrages utilisent la définition anglo-saxonne 
où F(x) = Px{X < x}. C'est une fonction en escalier, constante par morceaux, 
continue à gauche, définie ici par : 


FQ) = Ÿ {pi/x < x} 
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c'est-à-dire que c'est la somme des poids de tous les points qui sont strictement 
à gauche de x. Les propriétés de F seront étudiées dans le cas d'une v.a. conti- 
nue. 


Si par exemple X prend les valeurs x1 < x2 < ... < x,, on aura F(x) = 0 
pour x < X,, puis le graphe de F présentera un saut en chaque point x;, jusqu'à 
la valeur F(x) = 1 pour x > x,. 


À 


F(x) nr: 
\ Pn 

a — 

! k 

! ! 

! ! 

! ! 

! ! 

! ! 

! ! 

| 

RE <———— 1 | 

1P2 

| — | 

Pi l 1 l l 

! . 
%; x 0 M * x 
Figure 2.1 


On peut déduire de F les probabilités individuelles par : p; = F (x;:1) — F (x;) 
pouril<i<n—1letp, =1—F(x,). 


Exemple 2.3 
Variable certaine : F(x) = 0 pour x < a et F(x) = 1 pour x > a. 


F(x) À 
ls ————— 
0 a ra 


Figure 2.2 


Exemple 2.4 


Variable indicatrice : F(x) = 0 pour x < 0, saut de hauteur P;(X = 0) 
= 1—p avec F(x)=1-—p pour O0 <x<1l, puis saut de hauteur 
Px(X = 1) = p, puis F(x) = 1 pour x > 1. 
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Figure 2.3 


Exemple 2.5 


Jet de dé : F(x) = 0 pour x < 1, puis sauts de hauteur Px(X = i) = 1/6 
aux points i = 1,...,6 puis F(x) = 1 pour x > 6. 


F(x) À 
RE = — 
pe 
6 | + 
+ 
DCR 
= Al cd D mdr a 


Figure 2.4 


oments d'une v.a. discrète 


1) Espérance mathématique 


Définition 


On appelle espérance mathématique (expected value) de la v.a. X la quan- 
tité, si elle existe : 


E(X) = ” Pix; 
ieN 
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Il s'agit d'une moyenne en probabilité, ou moyenne pondérée, des valeurs x; 
que peut prendre la v.a. X, par les probabilités correspondantes p;. Chaque pro- 
babilité p; peut aussi s'interpréter comme la masse ponctuelle du point w; d'abs- 
cisse x; et E (X) est alors le centre de gravité, ou barycentre, de ces points 
affectés de masses. C'est une valeur numérique constante qui est la valeur 
moyenne, en probabilité, de X. Notons que si X prend ses valeurs entre x; et x,, 
on aura bien sûr x, < E(X) < x,. 


Si X ne prend qu'un nombre fini de valeurs, le calcul de E(X) peut se faire 
à l'aide du tableau de la distribution comme ci-après : 


Exemple 2.6 


Si X est la v.a. qui code 0 le résultat pile et I le résultat face d'un lancer 
de pièce de monnaie : 


1 1 1 


la valeur moyenne en probabilité de X est 1/2, bien que X ne prenne 
jamais cette valeur. 


Exemple 2.7 


Pour une v.a. indicatrice : 
E(X) =0 x Py(X =0)+1 x Px(X = 1) = P(A) = p 


Exemple 2.8 


Pour le jet de dé : 
6 


1 ï 
EX)=E)i=,=35 


i=1 


Exemple 2.9 
Dans le cas de la loi uniforme sur X(S) = {x1,...,xx}, c'est-à-dire avec 
équiprobabilité de toutes les valeurs p; = 1/k, on obtient : 


1 k 
E(X) —= k > 
i=1 


et dans ce cas E(X) se confond avec la moyenne arithmétique simple x 
des valeurs possibles de X (cependant la notation X pour l'espérance est 
à proscrire en général car ce n'est que dans ce cas particulier que 
E(X) = x). 
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À l'origine des probabilités, la quantité E(X) a été introduite pour traduire 
la notion de gain moyen, ou espérance de gain, la v.a. X représentant la valeur 
du gain à un certain jeu. 


Exemple 2.10 

Deux joueurs À et B jouent avec un dé, le joueur B gagnant les mises si 
le résultat est supérieur ou égal à trois ; sinon, c'est À qui gagne. La ques- 
tion est de savoir quelles doivent être les mises respectives a et b de ces 
deux joueurs pour que le jeu soit équitable. 


Les gains respectifs de ces deux joueurs sont représentés par les v.a. : 


__ja+b 2/6 _ ja+b 4/6 
xa= 4/6 Xn= | 2/6 


soit les espérances de gain E(X 1) = (a + b)/3 et E(X8) = 2(a + b)/3. 
Le jeu est considéré comme équitable si la mise est égale à l'espérance de 
gain, ce qui conduit aux conditions (a + b)/3 = a et 2(a+b)/3=b 
d'où b = 2a, résultat intuitivement évident puisque le joueur B a deux fois 
plus de chances de gagner. 


Propriétés 


Les propriétés de l'opérateur espérance mathématique sont celles du signe 
somme. 


P, | Si on ajoute une constante à une v.a., il en est de même pour son espé- 
rance : 


E(X+a)=E(X)+a, aerkR 


résultat qui se déduit de : 


D œ+a) = px+a 


P,| Si on multiplie une v.a. par une constante, 1l en est de même pour son 
espérance : 


E(aX)=aE(X), aeR 


5 Piax; — 4 ” Pix; 


i i 
P;| L'espérance d'une somme de deux v.a. est la somme des espérances 
(bien sûr si elles existent) : 


il suffit d'écrire : 


E(X + Y) = E(X) + EP). 


La première espérance fait intervenir deux v.a. distinctes et se calcule donc 
par rapport à la loi du couple (X,Y) qui est définie par les probabilités : 
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me lrnOsrYe=y), 1el,jed 


Les deux autres espérances se calculent par rapport aux lois marginales de 
X et Y qui s'obtiennent par sommations de la loi du couple : 


D D» = Px(X = x;) 
î 
D; = > Pi = P;Y = };) 
On calcule alors : 
E(X+Y) = dpi + y;) = D pux ‘ D Puy 
Gui i, j i, j 


= a D» > y» D» = D pix Le D psy 
i j j i i j 
On peut résumer ces trois propriétés en disant que l'opérateur espérance 


mathématique est linéaire : 
EUX +uY)=2E(X)+UE(Y), VLEeRVUER 


— Remarques 


L'espérance d'une constante réelle a est égale à la valeur de cette constan- 
te: E (a) = a. 


Si g est une fonction continue quelconque, alors : 


Elg(X)= Ÿ pig (x) 
ieN 


2) Variance 


Il s'agit d'un indicateur mesurant la dispersion des valeurs x; que peut prendre la 
v.a. X, autour de la moyenne en probabilité E(X) et défini par : 


VX) = ŸN_ pi - EXT 
ieN 
lorsque cette quantité existe. 


C'est l'espérance mathématique du carré de la v.a. centrée X — E(X) : 
V(X) = EIX — E(X)Ÿ 


moment centré d'ordre deux. On note cette quantité V(X) = of,0x désignant 
alors l'écart type (standard deviation) de X qui s'exprime dans les mêmes unités 
de mesure que la variable. 
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Exemple 2.11 
Lancer de pièce : 


_ fO(pile) 1/2 
en li (face) 1/2 


On avait calculé E(X) = 1/2, d'où : 
nie DUR) Ur 
72 Du}, Fa HJUT EE ER TA 


Exemple 2.12 


Pour la v.a. indicatrice : 


V(X) = E(X — p} = p(i — p} + (1 — p)(0 — p) 
= p(l— pi -p+p)=p(A—p) 


Exemple 2.13 


Pour la loi uniforme sur X(Q)=1{x;,...,x;} nous avions obtenu 
E(X) = x, d'où : 


k 1 k 
VO=) nm =r) 
i=1l i=1 


et la variance se confond ici avec la variance empirique des valeurs pos- 
sibles de X. 


Cet indicateur de dispersion vient compléter l'information sur la distribution, 
fournie par la valeur moyenne. 


Exemple 2.14 
Considérons les deux distributions suivantes : 
X 2 4 6 Y | —-4 3 33 
1/4 1/4 1/2 1/2 1/3 1/6 


Elles ont comme valeurs moyennes : 
EU =5+14+3=45 et EU)=-24+14+ À = 4,5 
donc même centre de distribution. Par contre : 
E(X9=1+4+18—23 et E(Y?)=8+3+121 x : —» 


d'où V(X) = 11/4 et V(Y) = 689/4, valeur très supérieure qui indique 
une dispersion de Y autour de sa moyenne beaucoup plus grande que 
celle de X. 
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Propriétés 


P, | Par définition : 


V(X) >0 
avec : 
V(X)=0< p;i[x —- E(X)]=0 VieN&x; = E(X) VieN 


la variance ne peut être nulle que si X = E(X) avec une probabilité égale à 
un, i.e. si X est une v.a. certaine : Py{X = E(X)} = 1. 


P, | Pour tout réel a : 


OPA) = MCE) 


c'est-à-dire que le moment centré d'ordre deux est invariant par translation ou 
changement d'origine. 
Ceci provient du fait que X + a — E(X + a) = X — E(X). 


P,| Pour tout réel a : 


V(aX) = a V(X) 


un changement d'échelle modifie la variance ; ceci est dû au fait que 
GX EG GX ACO IE. 


P,| Pour le calcul de la variance, il est souvent préférable d'utiliser la for- 
mule développée : 


VON = ER) EX) 
qui se déduit des propriétés de linéarité de l'opérateur espérance : 
V(X) = E[X°-2XE(X) + E’(X)] = E(X?) — 2E°(X) + E°(X) 
= E(X?) — E*(X) 


P;| Si X et Y sont deux v.a. indépendantes, alors : 


ON D) EAN) VO) 


cette propriété se déduisant du fait que dans ce cas E(XY) = E(X)E(Y), que 
l'on démontre aisément à partir de la condition d'indépendance qui s'écrit : 


PantX = xi,Y = y;} = Px{X = x;}Py{Y = y;} \i EN] € dl 


OÙ p;; = pi. X p.; avec les notations du paragraphe précédent. En effet : 


EXY)= D D puy = D px D p5 = ECOE(Y) 


i 


et alors : 
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VEN EE EX EI 
= E (X°) + E(Y?) +2E(XY) — E’(X) — E’(Y) -2E(X)E(Y) 
VON) EVE ECM EE 
On définit la covariance par Covu(X,Y) = E(XY) — E(X)E(Y) et on a 
donc dans le cas général : 


V(X + Y) = V(X) + V(Y) +2Covu(X,7) 


— Remarque 
Considérons la fonction g définie pour f réel par : 


g@) = EX — 1) = Ÿ pitt — 1) 
C'est un polynôme du second degré en f, de dérivée : 
gO=-2Y px 1) =-2[E(X) -1] 


qui s'annule en changeant de signe pour { — >, pix; = E(X) ; comme 
i 

g'(t) =2 > 0, g est minimum pour f = E(X), ce minimum étant la 
variance de X. Ainsi, E(X) est solution du problème : 

min E(X — 1} 

1E 

On peut également retenir comme caractéristique de valeur centrale la 

médiane Md, notamment dans le cas où l'espérance n’existe pas, nombre 
qui se définit par : 


P(X <Md)<-<P(X< Md). 


1 
2 
Elle vérifie aussi : 


E|X-Md|=infE|X -1f| 
teR 


3) Moments non centrés et centrés 


On appelle noment non centré d'ordre r € N* la quantité, lorsqu'elle existe : 
m,(X) = ŸÙ pix! = E(X"). 
ieN 
Le moment centré d'ordre r € N* est : 


LH, (X) = D p: [x; — E(X)] = EIX — E(X)]. 
ieN 


46 © STATISTIQUE ET PROBABILITÉS 


© Dunod. Toute reproduction non autorisée est un délit. 


Notons que ce moment centré peut s'exprimer, à partir de la formule du binô- 
me, en fonction des moments non centrés m,,m,_1,...,mM.. Les premiers moments 
sont : 


mi(X) = E(X),(X) = 0,(X) = m(X) — mi(X) = V(X) 


ariable aléatoire réelle continue 


éfinition 
On appelle v.a. réelle définie sur (@,.4) une application X : @ — R telle que 
pour tout intervalle Z CR on ait: 
X-!()={weQR/X(w)EI}E A 


Cela exprime que l'image inverse d'un intervalle quelconque est un événe- 
ment. Il suffit en fait de vérifier que pour tout réel x : 


X-1(]-00,x[) € À 


Exemple 2.15 


La durée de vie d'une lampe ou le salaire d'un individu tiré au sort dans 
une population sont représentés par des v.a. continues. 


oi de probabilité 


Elle est déterminée ici par la fonction de répartition (f.r.) F, définie pour tout x 
réel par : 


F(x) = Px(X < x) = P{X 7 (-co,x[)} = P {o € Q/X(o) < x} 


qui représente la probabilité que X soit strictement à gauche de x. 


ropriétés de la fonction de répartition 


P, | Elle est croissante au sens large. 


En effet, pour x < y on a (X <x)— (X < y) et par conséquent 
F(x) = Px(X < x) < Px(X < y) = F(y). 
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P;| Elle prend ses valeurs entre 0 et 1 : 


O0 < F(x) <1 avec lim F(x) =0 et lim F(x) = 1 


En effet, F(x) est une probabilité et quand x — — l'intervalle ]—co,x| 
devient Ÿ et X-!(4) = Ÿ ; quand x — +00, l'intervalle ]J—-c,x[ devient R et 
X-(R) = Q. 


P;| Elle est continue à gauche : 


lim F(x — h) = F(x) 


h=0+ 


car l'intervalle ]—-c,x — h[ ne contient jamais le point x et devient donc l'in- 
tervalle ]—oo,x[ quand h — 0*. 


On peut établir que ces trois propriétés sont caractéristiques d'une fonction 
de répartition. Si on retient la définition F (x) = Px (X < x), cette fonction F 
est alors continue à droite. 

Par contre, pour tout h > O l'intervalle ]—oo,x + A[ contient toujours le 
point x et devient l'intervalle ]—oo,x] = ]J—oco,x[ U{x} quand h — 0. Par 
conséquent : 


lim F(x+h) = F(x) + P;(X = x) 


h—0+ 
Aïnsi, aux points x de discontinuité de F, son graphe présente un saut de hau- 


teur Py(X = x) : voir figure 2.5. 
P,(X = x) 


Figure 2.5 


P,| La probabilité de l'intervalle [a,b[, pour a < b, se calcule par : 


Py(a < X <b) = F(b) — F(a) 


On a en effet ]—oco,b[ = ]—oco,a[ U[a,b[ donc : 
Px(X <b) = P;(X < a) x+ Py(a < X < b). 


oi continue 


Si la fonction F est continue, i.e. continue à droite, on dit que X est une 
variable aléatoire réelle continue. Dans ce cas, pour tout réel x : 


Px(X = x) =0 
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c'est-à-dire que la probabilité d'un point est toujours nulle, ce qu'on traduit en 
disant que la loi est diffuse. Dans le cas où certains points ont une probabilité 
non nulle on dit que la loi est mixte, comportant une partie continue et une par- 
tie discrète correspondant à ces points. 


Exemple 2.16 

Considérons la fr. F définie par : 

si x<0 

si O<x<l 


F (x) = 
si 1l<x<2 


RNDIKRIEK © 


Si 2<x 


Cette fonction est continue pour x = 0 et x = 2. Par contre, si elle est 
bien continue à gauche en x = 1, comme toute fr, avec lim F (1 —h) 
h—0+ 


= F (1) = 2’ elle n'est pas continue en ce point car : 
1 1 
lim F(1+h)= lim -(+h)=-=F(1)+P;(X=1 
n=0+ ( ) n0+ 2 ) 2 (Se x ( ) 
et par conséquent il s'agit d'une loi mixte, avec une partie continue sur les 


intervalles ]—-co,1[ et ]1,+ool, et une partie discrète concentrée au point 


1 
Sr CLR 


Exemple 2.17 


On peut donner également un exemple plus concret, qui est celui d'une 
va. X représentant la durée de vie d'une ampoule qui suit une loi expo- 
nentielle (cf. chap. 3, $ IL, B). S'il y a une probabilité p > 0 que cette am- 
poule claque lorsqu'on l'allume, la fr. de X est alors définie par : 


_ f0 si Xx<0 
HO CNP si x >0 


avec donc une masse non nulle au point x = 0 : 


lim F(0+h)= p = P;(X =0) 
h=0+ 


oi absolument continue 


La valeur moyenne de la probabilité d'un intervalle de longueur h > 0 est: 


1 F h)-F 
nlxG<X<x+h)= EN = 
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et représente donc une densité moyenne, puisqu'étant le « poids » (probabilité) 
de l'intervalle, divisé par sa longueur. Si on fait tendre cette longueur vers 0, la 
limite, si elle existe, représentera la probabilité d'un intervalle de longueur infi- 
niment petite dx. Ce sera le cas si F admet une dérivée f: 


1 
lim = LG +) — FE FD = FO) 


Dans ce cas, l'équivalent de la probabilité du point x pour une loi discrète 
peut s'écrire symboliquement Px(x < X < x + dx) = f(x)dx, la fonction 
f = dF/dx étant appelée densité de probabilité de la v.a. X dont la loi est alors 
qualifiée d'absolument continue. Dans ce cas la loi de X est déterminée par sa 
densité f puisque F est définie comme la primitive de f qui s'annule pour 
X = —@ : 


F(x) = a f(dt 


Figure 2.6 


—+- NB : On peut trouver des exemples, assez complexes, où Fest continue 
et strictement croissante mais n'admet pas de densité, c'est-à-dire de cas 
où la loi est continue mais pas absolument continue. Dans la pratique, les 
lois usuelles que nous rencontrerons seront soit discrètes, soit définies par 
une densité. 


Propriétés 


P, | Une densité est positive : 


HAO 


propriété immédiate puisque f est la dérivée d'une fonction croissante au sens 
large. 
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oments d'une v.a. absolument continue 


1) Espérance mathématique 


Elle est définie par : 
+00 
Eco = | xf(x)dx 


lorsque cette intégrale généralisée existe, c'est-à-dire est convergente. Les pro- 
priétés de l'espérance sont celles de l'intégrale et sont identiques au cas discret, 
1.e. il s'agit d'un opérateur linéaire : 


Propriétés 


P, | Pour tout réel a : 


E(X + a) = E(X) + a 


P, | Pour tout réel a : 


E(aX) = aE(X) 


P;| Si X et Y sont deux v.a. qui admettent une espérance : 


E(X+Y)=E(X)+E(Y) 


2) Variance 


Elle est définie par : 
+00 


V(X) = EIX — EGP = 1 Lx — ECO fx 


= E(X?) — EX) = 0 


lorsque cette intégrale généralisée existe. Ses propriétés sont identiques au cas 
discret : 


Propriétés 


P, | C'est une quantité positive : 
V(X) >0 


avec V(X) = 0 & X est une v.a. certaine (donc une v.a. discrète !). 


P, | Pour tout réel a : 


V(X + a) = V(X) 


P; | Pour tout réel a : 


V(aX) = a V(X) 
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P,| Si X et Y sont deux v.a. indépendantes admettant une variance : 


V(X+Y) = V(X) + V(Y) 


3) Moments non centrés et centrés 


Le moment non centré d'ordre r € N° de X est la quantité, lorsqu'elle existe : 


+00 
m. C0 = EX = [x rod 
Le moment centré d'ordre r € N* de X est la quantité, lorsqu'elle existe : 
+00 
u,(X) = ETX — E(X)T = Î Lx — E(X)T f )dx 


a) Paramètres d'asymétrie 


L'asymétrie d'une distribution peut se caractériser par le moment centré d'ordre 
trois. 


La distribution est : 
— symétrique Si 3 = 0 ; 
— dissymétrique étalée vers la droite si 3 > 0 ; 


— dissymétrique étalée vers la gauche si u3 < 0. 


u3>0 u3=0 U3<0 
Figure 2.8 


Pour obtenir un paramètre indépendant des unités, on considère les coeffi- 
cients de symétrie (skewness) : 


— de Pearson : 
2 
H3 
Bi = LE 
— de Fisher : : 
__ 43 
Yi — mi 


b) Paramètres d'aplatissement 


Ils sont calculés à partir du moment centré d'ordre quatre ; ce sont les coeffi- 
cients d'aplatissement (kurtosis), invariants aussi par changement d'échelle ou 
d'origine : 
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— de Pearson : 


— de Fisher : 
r 
n=B-3= 5-3 


Le terme de comparaison est ici la loi normale standard pour laquelle 
B2 = 3, avec y > 0 pour une distribution plus aplatie que la distribution nor- 
male de même moyenne et de même écart type. 


hangement de variable 


On cherche à déterminer la loi de probabilité de la v.a. Y = h(X), connaissant 
la fonction de répartition (f£.r.) de la va. X. Ceci se fera sans difficulté si h est 
une application réelle continue et bijective, donc inversible. La f.r. de Y est en 
effet définie par : 


GO) = Pr CE < y) = Px{h(X) < y} 


Nous allons alors distinguer deux cas : 
— h est croissante : 
h(X) <y & X <h7"(y) 


et G(y) = Px{X <h1)} = F[h 7 )] 


x h\(y) 


h(X) 
Figure 2.9 


— h est décroissante : 


h(X) <y&X>h (y) 


et GO)=Px{X >h@)}=1-F[h"O)] 
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h\(y) 2.6 


R(X) 
Figure 2.10 
Si X admet une densité f et que h est de plus dérivable, on peut déterminer la 


densité g = dG/dy de Y par dérivation. Dans le premier cas (h'° > 0) : 


A 7 O) FT ON 
du u=h=1(y) dy h'[h-(y)] 


80) = | 


Dans le second cas (h' < 0) : 


__— El do) flo) 
du u=h=1(y) dy h' [h=! (p)l 
Dans les deux cas la densité de Y peut s'écrire sous la même forme : 
7 Lol 
IR ER OI 


— Remarque 


Même dans le cas où la fonction A n'est pas inversible, on peut parfois 
déterminer la loi de Y — A(X). Considérons par exemple A(x) = x? ; la 
fonction h n'est pas injective car h(—x) = h(x) pour tout x réel et cepen- 
dant on peut déterminer la loi de la v.a. positive Y = X?, car pour y > 0 : 


X'<y&-/y<X<,/y 


d'où G(y) = Py(Y < y) = Px(—- 5 <X < y) = F(/>) —- F(-/)). 
Bien entendu pour y < 0 on a G(y) = 0. Si X admet une densité f, alors 
Y admet comme densité pour y > 0 : 


80) = 7 LA (5) + (I 
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Figure 2.11 


À retenir 


Une variable aléatoire (v.a.) X est une application qui à un événement 
fait correspondre un nombre. 


La loi de probabilité d'une v.a. peut toujours être définie par sa fonction 
de répartition (fr.) F, où F (x) représente la probabilité de toutes les 
valeurs strictement inférieures au réel x. 


S1 l'ensemble des valeurs possibles de X est dénombrable, 1.e. s'il existe 
une bijection permettant de le représenter par l'ensemble des x;,i e N, la 
v.a. est dite discrète et sa loi est définie par l'ensemble des couples 
Gti, pi);eN avec pi = Px (X = xi). 

S1 l'ensemble des valeurs possibles de X est un sous-ensemble non 
dénombrable de R, la v.a. X est dite continue. Dans le cas où sa fr. Fest 
dérivable, sa loi est définie par sa densité de probabilité f qui est la fonction 
dérivée de F : f = F'. 

Les deux principales caractéristiques d'une distribution de probabilité 
sont : 


— l'espérance mathématique E (X) qui est une caractéristique de valeur 
centrale : 
+00 
DOS OUR EONE Î xf (x) dx 
ieN ne 
— la variance V (X) qui est une caractéristique de dispersion autour du 
centre : 
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V(X)=EIX - E(X)Ÿ = E(X?) -E?(X) 
Le calcul de la variance s'effectue presque toujours à partir de la for- 
mule développée : espérance du carré moins carré de l'espérance. 


Principales propriétés de ces moments : 
VaeR,VbeR, E(aX+b)=aE(X)+b 


V (aX + b) = a?V (X); 
VAER.VUER, E(X+uY)=X\E(X)+uE(Y) 


et, si les v.a. X et Y sont indépendantes, alors : 
V (X +uY) = 22V (X) +uV(Y) 


Pour déterminer la loi de probabilité de la v.a. Y = h(X), même dans 
le cas où la loi de X est définie par sa densité, il est presque toujours préfé- 
rable de déterminer au préalable sa fonction de répartition, et éventuelle- 
ment de dériver ensuite pour obtenir la densité. 


Compléments 


pplication mesurable 


La notion de variable aléatoire réelle peut être définie de façon générale, sans distinction 
entre les cas continu et discret, en introduisant la notion d'application mesurable. Pour 
cela, nous définissons sur l'espace métrique R sa tribu borélienne, notée B, qui est la 
tribu engendrée par les intervalles ouverts (ou fermés), c'est-à-dire la plus petite tribu 
contenant cette famille d'intervalles. Une variable aléatoire réelle X est alors définie 
comme une application mesurable de (2,4) dans (R,B) , c'est-à-dire telle que : 


VBEB, X-!'(Bje A 
En fait, pour vérifier que X est bien une application mesurable, il suffit de vérifier 
cette condition pour une famille particulière d'intervalles, comme celle des ouverts de la 
forme |—00,x{ , c'est-à-dire de vérifier que : 


VxeR, X-!(]J-cæ,x|) e À 


Notons comme propriété utile que toute application continue de (R,B) dans (R,B) 
est mesurable. 
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ensité 


Si la loi de probabilité Px d'une v.a. X admet une densité, celle-ci est la dérivée de la 
fonction de répartition de cette loi. Cependant, la définition d'une densité ne se fait pas à 
partir de cette notion analytique de dérivabilité, mais à partir de notions plus complexes 
que nous allons évoquer. Cela nécessite d'introduire la mesure de Lebesgue À sur (R,B), 
qui est la mesure diffuse prolongeant la notion de longueur, la mesure de l'intervalle 
la,b] étant définie par À (Ja,b]) = b — a. Si pour tout borélien B € B tel que 
À (B) = 0 on a Px (B) = 0, on dit que la loi de probabilité Px de X est absolument 
continue par rapport à la mesure de Lebesgue et alors cette loi admet une densité. 


upport 


Le support d'une loi Px est l'ensemble de tous les points x tels que tout intervalle ouvert 
contenant x a une probabilité positive : 


Ve > 0, Pxflx —-e,x+ef[} > 0 


Exemple 2.18 
Soit Px la loi de probabilité définie sur l'ensemble des rationnels Q = {qn},eN 


1 
par Px (Qn) = A C'est une loi discrète mais dont le support est pourtant R car 


tout intervalle ]x — e,x + el contient au moins un rationnel, quel que soit 
e > 0 et par conséquent Px (]x — &,x + ef) > 0 pour tout x € KR. 
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Exercices 


noncés 


Exercice n°1 


Soit l'ensemble fondamental = {a,b,c} et la tribu associée À = {,{a,b},{c},Q}, 
les événements a et b étant indiscernables. On définit l'application réelle X sur 2 par 
X(a)=1,X(b)=2 et X(c) =3. 


1) S'il y a équiprobabilité des événements élémentaires, peut-on définir la loi de proba- 
bilité de X ? 
2) Si la probabilité P est définie sur (Q@,.4) par P({c}) = 1 et si on définit l'application 


Y sur @ par Y (w) = 3 pour tout w de @ , calculer P(X = Y). Peut-on en conclure que 
X et Y ont même loi de probabilité ? 


Exercice n°2 


Soit l'ensemble fondamental @ = {a,b,c,d,e} et la partitition Il = {{a,b},{c,d},{e}} 
sur laquelle on définit la probabilité P par P({a,b}) =2/5, P({c,d}) = 1/5 et 
P({e}) = 2/5. Deux applications f et g sont définies sur © par f (a) = f(b) = g(c) 
= g(d) = g(e) = —2, f(c) = f(d) = g(a) = g(b) = 2 et f(e) = 0. Peut-on défi- 
nir la loi de probabilité de l'application X = f/g ? 


Exercice n°3 


Vous participez à un jeu où vous avez la probabilité p de remporter une partie. Si vous 
gagnez deux parties consécutives le jeu s'arrête et vous emportez un gain de 40 — 4N 
euros, N étant le nombre total de parties jouées. Le nombre maximum de parties jouées 
est fixé à quatre et vous donnez à votre adversaire dans ce jeu la somme de 25 euros en 
cas de perte. Ce jeu vous paraît-il équitable ? 


Exercice n°4 


Une urne contient cinq boules, deux qui portent le numéro 1 et trois qui portent le numé- 
ro 2. On effectue deux tirages successifs sans remise dans cette urne. On appelle coïnci- 
dence le fait de tirer une boule de numéro i au i-ème tirage, avec i — 1,2. Déterminer 
la loi de probabilité de la variable aléatoire X qui représente le nombre de coïncidences 
observées, puis calculer E (X) et V (X). 


Exercice n°5 


Une urne contient une boule qui porte le numéro 0, deux qui portent le numéro 1 et quatre 
qui portent le numéro 3. On extrait simultanément deux boules dans cette urne. 
Déterminer la loi de probabilité de la variable aléatoire X qui représente la somme des 
numéros obtenus puis calculer E (X) et V (X). 


Exercice n°6 


On considère n urnes qui contiennent chacune a boules noires et b boules blanches. On 
tire au hasard une boule de l’urne U, que l’on place ensuite dans l’urne U,. Puis, on tire 
au hasard une boule de l’urne VU, que l’on place ensuite dans l’urne U;. Et ainsi de suite, 
la boule tirée de l’urne U,_1 étant placée dans l’urne U,. On note p, la probabilité de 
tirer une boule noire de l’urne U,. Calculer p;,p2 et en déduire par récurrence la valeur 
de Py. 
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Exercice n°7 


La fonction de répartition F d'une v.a. X est définie par : 

0 si x<l 
1—1/(1 x2) si 1<x<2 
FX) = 1—1/(2%Xx3) si 2<x<3 


1—1/nin+1) si n<x<n+l 


Let 


1) Calculer les probabilités p, = P(X = n),n € N*. 
2) Calculer E(X) et V(X). 

Exercice n°8 

Soit X une v.a. de fonction de répartition F définie par : 


e*/3 pour x <0 
1 pour x >0 


F9 = | 


La loi de X est-elle continue ? 


Exercice n°9 


Soit X une variable aléatoire de densité nulle en dehors de [—1,1] et dont l’expression 
pour x e [—1,1] est : 


3 
FO = VTT 
Déterminer la fonction de répartition de X. 


Exercice n°10 


Soit X une variable aléatoire de densité f(x) = x pour x € [0,1], f(x) = 2 — x pour 
x € [1,2] et nulle en dehors de ces intervalles. 


1) Déterminer la fonction de répartition de X et en déduire la médiane de cette loi. 


2) Calculer P{|X — 1| < x} pour x réel quelconque. 


Exercice n°11 


1 3 1 1 3 
Soit X une variable aléatoire de densité f(x) = 5 pour x | 7 | ,et x | | x 


et nulle en dehors de ces deux intervalles. 


Déterminer la fonction de répartition de X. 


Exercice n°12 


Soit X une v.a. de densité : 
2 


re {al a) si0 < x <a 


sinon 


où a est un réel strictement positif. 
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1) Déterminer la fonction de répartition (f.r.) de X. 

2) Calculer E (X) et V (X). 

3) Soit X:1,...,X, des v.a. indépendantes, de même loi que X. Déterminer la f.r., puis la 
densité, de la v.a. M, — max{X,,...,X,}. 

Exercice n°13 


Soit X une v.a. de densité f continue et strictement positive, de fonction de répartition F. 
Exprimer à l'aide de f et F la densité et la fonction de répartition de chacune des v.a. sui- 
vantes. 


1)Y=aX+b,aeR*, bEeR. 


2Z=IX|. 
3)T =InlX|. 
4) U = F(X). 


5) V = [X], partie entière de X. 


Exercice n°14 


1 3 
Soit X une variable aléatoire de densité f(x) = — + —x? pour x € [—1,1] et nulle en 
: 4 4 
dehors de cet intervalle. 


1) Déterminer la densité de la v.a. Y = X?. 


2) Calculer E(Y). 


orrigés 


Exercice n°1 


1)0na X_!(1) = {a} # A donc l'application X n'est pas une v.a. et on ne peut donc pas 
lui associer une loi de probabilité. 


2) On a : 
P(X =Y) = P({w e R/X(w) = Y(w)}) = P({c}) = 1 


donc ces deux applications sont égales avec une probabilité égale à 1 (événement cer- 
tain). L'application Y est constante, avec Y —!(3) = Q, donc c'est une variable aléatoire 
certaine : P(Y = 3) = 1. Cependant on ne peut pas en conclure que la loi de X est la 
même, puisque X n'est pas une variable aléatoire et que cette notion n'a donc pas de sens. 


Exercice n°2 


L'algèbre engendrée par la partition est : 


A = {ÿ,{a,b},{c,d},{e},{a,b,e},{c,d,e},{a,b,c,d},Q)} 
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L'application X ne peut prendre que les valeurs — 1, 0 et 1 avec : 
X7'(-1) = {o € Q/f(oœ) = —g(œ)} = {a,b} U ({c,d}N {c,d,e}) 
= {a,b,c,d} € A 
X7"(0) = {w € Q/f(w) = 0} = {e} € A 
X7"(1) = {o € Q/f(&) = g(w)} = ({a,b}N {c,d,e}) U ({c,d} N {a,b}) 
=feA 


Donc X est bien une variable aléatoire dont la loi de probabilité est définie par : 


2 3 
Px(X =0)= P(eh == et Px(X = 1) = P(abc.d}) = = 


Exercice n°3 

Si le nombre de parties jouées est deux ou trois, c'est que vous avez gagné les deux der- 

nières parties et donc P(N = 2) = p°? et P(N = 3) = gp? où q = 1 — p. Vous avez 

gagné, événement noté E* , à l'issue de quatre parties avec une probabilité qui est : 
PAN =A4}NE*) = pqp° + q°p° = qp° 

La probabilité de perdre à l'issue des quatre parties jouées est : 


P==1—P(N=2)— P(N=3)-— P{N=A4}NE*) 


L'espérance de gain à ce jeu est alors : 
4 
E(G) = ÿ_ (40 — 4k)P({N =k}NET)—-25P7 
k=2 


= 32p°? + 28qp° + 24qp° — 25(1 — p? — 2qp°) 
= 57p? + 102qp° — 25 = —102p° + 159p° — 25 


Le jeu est considéré comme équitable si cette espérance est nulle puisqu'il n'y a pas de 
mise initiale. L'espérance est bien sûr une fonction croissante de p, de valeur — 25 pour 
p = 0 et 32 pour p = 1. Pour p = 1/2 on obtient E(G) = 2, donc le jeu sera consi- 
déré comme équitable pour une valeur de p un peu inférieure à 1/2. 


Exercice n°4 
Le nombre possible de coïncidences est 0,1 ou 2. Aucune coïncidence correspond au tira- 
ge d'une boule 2, puis d'une boule 1 : 


P(X=0)= P(21) > 
= 0) = = ge, 
5 4 10 
Une coïncidence unique peut se produire au premier ou au second tirage : 


PRz De Bu) EPL EN TES 2e 
AT RANCE "Inn 


Pour deux coïncidences : 


3 
10 


Pose here 
5 4 
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On calcule ensuite aisément : 


4 6 di ve 12% 16 6 3 
E(X)=—+—=1 E(X)==+— == V(X)=—==Z7 
DE Gt ) 1010 10 "35; 


Exercice n°5 


On note (i,j) l'événement « avoir tiré les boules i et j » ; pour i = j il y a une seule 
façon d'obtenir ce couple et deux pour i  j. On obtient ainsi : 


P(X=0) = P(0,0)=0, 
1 2 2 
( ) (0,1) “10e 45° 
PX=D = POD+P(LD=ZS; 
10 
P(X=3) = POD+POD= 
11 
PX=4 = POD+PGD= ES; 
P(X=5) = P(G,2 = 12 FR=0 = 
=5) = PGD= RS PX=6 =, 
On en déduit : 
160 16 
E(X)=4 EURE V (X) = — 
Exercice n°6 
On obtient : 
_ a 
GE 
P2 = P(NN:) + P(N2B1) = P(ND)P(NIN:) + P(B:)P(N:1B:) 
a+l a a 
— 1 — 
pen ON pi ace 


De la même manière : 


= pepe 
Pn — Pn-1 a+b+l Pn-1 


a 
a+b+l 


Par récurrence, si on suppose que p,_1 = p. on en déduit alors p, = p1. 


Exercice n°7 
1) On obtient : 
1 1 
= PX=D=PX<2=F@=1-:=; 


pr = P(X = 2)= P(X < 3) — P(X <2) = FG)— FO) = 
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et plus généralement pour n > 2 : 


1 1 
pr = PA <n + D PQ <= [1 er) Ë es) 
2 


n(n? — 1) 


2) On obtient comme espérance : 


ie 9) me I 
FRS 22 een in) 


n=2 


(DEN 


ph es 
=; = 


Par définition : 
© 1 : 2n 


TUE 2 
EX) = > n D een 


n=1l n=2 


Or le terme général de cette série est équivalent à 2/n, terme de la série harmonique 
divergente, donc cette variable aléatoire n'admet pas de moment d'ordre deux. 


Exercice n°8 


Par définition F (0) = 1/3 et, comme toute fonction de répartition, on vérifie que F est 
continue à gauche en ce point : 


10e 1 
F(0 Des Fa ro quand h — 0* 
Par contre F(0 + 0) = 1, donc F est discontinue à droite. La loi est mixte, avec un seul 
point de probabilité non nulle : 


P(X =0) = F(0 +0) — F(0) = 2/3 
Exercice n°9 
On a F(x) = 0 pour x < —1 et F(x) = 1 pour x > 1. Pour —1 < x < 0 : 
3 f° 1/2 1 3/2 
EF) ==} (+0 "dt = -(1+x) 
4 J_; 2 


Pour0 £<x< 1 : 


EG) = F(0) + so UE 
4 J, 2 
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Exercice n°10 


1) On a F(x) = 0 pour x < 0 et F(x) = 1 pour x > 2. Pour 0 < x < 1 : 
2 
x 


Fe [rare 


Pour 1 < x < 2 : 

x 2 
F@= FD+ fe bdt = 7 +2x 1 
1 


La médiane est le centre de symétrie de la distribution soit Md = 1. 
2)Onah(x) = P(IX — 1| < x) = 0 pour x < 0 et pour x > 0 : 
hx)=PA-x<X<1+x)=FA+x) -F(1—-x) 
Ainsi h(x) = 1 six > 1 et pour 0 < x < 1 : 
h(x) = 2x — x? 


Exercice n°11 
On a F(x) = 0 pour x < —3/2 ; pour —3/2 < x < —1/2: 


F(x) je ne 
x) = —du==+- 
Fe 24 


Pour —1/2 < x < 1/2: 


Pour 1/2 < x < 3/2: 


Et enfin, F(x) = 1 pour x > 3/2. 


Exercice n°12 


1) Lafr. F de X est nulle pour x < 0, a pour valeur 1 pour x > a et a pour expression, 
quand0 <x<a: 


2 f*" t 2 PT 2x x 
œ “| ( jai a É = | a ( ) 


2) On obtient : 
2 a 2 2 2 3 
E(X) = Î Pere ere ee 
a Jo a a \ 2 3a 3 


On calcule de même : 


2 a 3 2 3 4 2 
E(x)=€ | x ax = £ LEA 
a Jo a a \ 3  4a 6 


On en déduit la variance : 


a 


V(X)=E(X?) - E°(X) = 1 
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3) On calcule la fr. de M, : 
G(x)= P(M, < x) = ant =») =[[P@G<0=7r" (0 
i=1 i=1 


On obtient la densité par dérivation : 


g@)=G'x)=nF"" (0) f @ 


Donc pour 0 <x<a: 


= (+ GS)" {GS 


Exercice n°13 


La méthode la plus simple consiste à déterminer la fonction de répartition (f.r.) de la nou- 
velle variable, puis à la dériver pour obtenir la densité. 


1) Par définition : 
G(y) = PY < y) = P(aX +b < y) = P(aX < y —b) 


Pour pouvoir exprimer cette probabilité à l'aide de la fr. de X, il faut distinguer deux cas 


suivant le signe de a. 
— b —b 
co=P(x<i—)-r(2 ) 
a a 


Sia > 0: 
b 
80) = GO) = I ( ) 
co=P(x> 2) =: F(2—) 
a a 


’ y—b 
80) = GO) = te ) 


Ainsi, pour a € R*, la densité de Y peut s'écrire : 


—b 
g(y) = 6 ) 
ja” a 


2) La fr. de Z est définie par H(z) = P(Z < z) = P(IX] < 7), donc H(z) = 0 pour 
z <0. Pourz > 0: 


Pour a < 0: 


H(z)= P(-z<X <z)= F(z) — F(-2) 
h(z) = H'Q) = fQ) + f(-2) 


Remarquons que le changement de variable s'est effectué à l'aide de la fonction : 
x+H |x| qui n'est pas injective et cependant nous avons pu déterminer la loi de |X|. La 
densité de Z présente une discontinuité pour z = 0 puisque h(z) — 2f(0) > 0 quand 
z — 0*, alors que bien sûr H est continue, avec H(z) — F(0*) — F(07) = 0 
— H(0). 
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3) On obtient : 
K(t) = P(T <t) = P(in|X| <t) = P(IX| <e') = H(e') = F(e!) — F(—e!) 
KG) = K'(9 = e'[f(e') + f(—e)] 


4) La fonction F étant dérivable est bien sûr continue ; comme de plus elle est strictement 
monotone, elle admet une fonction réciproque F—! définie sur [0,1] et aussi strictement 
monotone, donc pour 0 < u < 1 : 


P(U =û) = PIFOO <= PIX <F = Fr [Fr |=4 
La variable U = F(X) suit donc une loi uniforme sur [0,1]. 
5) La variable V est bien sûr à valeurs entières, avec pour v € N : 
P(V =v) = P{X]=v) = P(v<X <v+1)= F(v+1)— F(v). 


Pour v entier négatif, on a P([X] = v) = P(v < X < v +1), ce qui ne change rien 
pour la valeur de cette probabilité puisque la loi de X est continue. Aïnsi, pour tout 
veZ, P(V = uv) = F(v+1)— F(v). 


Exercice n°14 
1) La fonction de répartition G de Y est nulle pour y < 0 et pour y > 0: 


GO)= P(-V5 <X < V5)= F(V5)- F(-V5) 


La densité s’obtient par dérivation, soit pour y > 0 : 


1 


8OE37 LE (9) + FC] = 


1+3y 
AV 


2) On obtient : 


1 f! 7 
= 3 [ (Vr+35V5)dr = = 
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ois usuelles 


i on améliore la compréhension et l'analyse d'un phénomène com- 

plexe par l'introduction d'un modèle qui la simplifie, celui-ci ne 

doit cependant pas être trop éloigné de la réalité. Nous allons pré- 
senter ici les principaux modèles qui peuvent être retenus pour une 
modélisation aléatoire. Ce « catalogue » des lois usuelles distingue enco- 
re entre lois discrètes et lois admettant une densité de probabilité. 


Objectif du chapitre : présenter les principales lois de probabilité pouvant 
être retenues dans la modélisation statistique. 

Concepts clés étudiés : variable de Bernoulli, schéma binômial, schéma 
hypergéométrique, loi de Poisson, loi uniforme, loi exponen- 
tielle, loi normale, loi du khi-deux. 


ois usuelles discrètes 


oi de Dirac 


Soit a € R un point fixé. On appelle loi de Dirac, notée 6,, la loi de la v.a. cer- 
taine X qui est constante, prenant la même valeur a quel que soit le résultat de 
l'épreuve : 


X(w)=a, VNoeQ 
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Ainsi : 
X(Q) = {a}, P;(X = a) = P{we Q/X(w) = a} = P(Q)=1 
0 si x<a 
F@)= {|} Si x >a 


Le graphe de F présente un saut de valeur 1 au point de discontinuité a, qu'on 
appelle échelon de Heaviside. 


F(x) À 


Figure 3.1 


Bien entendu, on obtient comme moments : 
E(X)=a et V(X) =0. 


Rappelons que c'est la seule v.a. dont la variance est nulle. 


oi de Bernoulli 


Soit À € À un événement quelconque ; on appelle v.a. indicatrice de l'événe- 
ment À, la v.a. définie par X = 1,, c'est-à-dire : 


1 si A 
LG) = UGS {6 à oe4 


Ainsi X(Q) = {0,1} avec : 


Px(X = 0) = P {w € R/X(w) = 0} = P(ÀA) = 1 — P(A) 
Px(X = 1) = P{w € R/X(w) = 1} = P(A) 


On dit que X suit une loi de Bernoulli de paramètre p = P(A), ce qu'on écrit 
symboliquement X --B(1,p) ou sous la forme suivante : 


= [T.p 
x= {6 g=il-p 
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La fonction de répartition est définie par : 


0 si x<0 
F(x)=igqg si 0<x<l 
1 si 1<x 


Figure 3.2 


Exemple 3.1 


Dans une population de n individus, on associe à chacun d'eux une va. 
de Bernoulli, indicatrice de possession d'un certain caractère À : 


1 si i possède le caractère À 
O si i ne possède pas le caractère À 


x. | 


Le paramètre p = P(A) représente la proportion d'individus de la popu- 
lation qui possèdent ce caractère À. 
Les moments de cette loi sont : 
E(X) = 1x P(A)+0 x P(A)= P(A)=p 
E(X?) = 1? x P(A) +0? x P(A) = P(A) 
V(X) = E(X?) — E°(X) = P(A) — P°(A) = P(A)P(A) = pq 
&3(X) = pQ — p} + — p)(O— p} = p( — p}(1 — 2p) 


oi binômiale 


S1 on effectue n épreuves successives indépendantes où on note à chaque fois la 
réalisation ou non d'un certain événement À, on obtient une suite de la forme 
AAAAA... AAA. À cet événement élémentaire w on associe le nombre X (w) 
de réalisations de À. On définit ainsi une v.a. X qui suit une loi binômiale de 
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paramètres n et p — P(A), caractérisée par X(2) = {0,1,...,n} et pour 
ke X(Q) : 


Px(X = &) = (5 )pfQ = py* 


car () est le nombre d'échantillons de taille n comportant exactement k évé- 


nements À, de probabilité p', indépendamment de l'ordre, et donc n — k événe- 
ments À, de probabilité (1 — p}"-*. On écrit X -= B(n,p). Pour calculer facile- 
ment moments de cette loi, nous allons associer à chaque épreuve 
i,l<i<n, une v.a. de Bernoulli : 


 — 1 si À est réalisé 


O0 si À est réalisé 


On peut alors écrire : 
X=X; +X:+...+X, 


d'où on déduit aisément : 


E(X) = ef x) — 5 E(X:) = np 


et : 


V(X) = v(>x) = S V(X;) = npq 
i=1 i=1 


car les v.a. X; sont indépendantes. 


On vérifie bien que c'est une loi de probabilité : 


5 Px(X = k) = » Cria- p'f=tp+( pl =1 


k=0 


Le calcul direct des moments de X peut s'effectuer à partir de la définition 
générale, mais de façon beaucoup plus laborieuse : 


n 


= n = n! DE 
E(X) — DA — D rer ‘ 


n 


_ n! k n—k 
7 E rene 


(a — 1)! p“ig""# Fe) piqg""\"i 
re" ‘ =} ne 
= np(p +q)""=np 


Pour obtenir E(X?) par un procédé de calcul identique, on passe par l'inter- 
médiaire du moment factoriel E [X(X — 1)] = E(X?) — E(X) : 
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n! . 
HDi 


n—k 


EIX(X—1)]= 3 &k&—1) q 


k=0 


. Gi —2)! re 
D == S 47 


n—2 


=na—t1)p Ù( : 2) pig" 2") = n(n — 1)p°"(p +4) 


j=0 


= n(n— lp" 


on en déduit alors E(X?) = nn — 1)p° + np, puis: 
VX) = np" +np(l—p) —n°p° = npq. 


Exemple 3.2 


Le nombre de résultats pile apparus au cours de n jets d'une pièce de 
monnaie suit une loi B(n,1/2) : 


1 k 1\7* (2) 
=D = (1) (;) G) =. 0<k<n 


avec E(X) = n/2 et V(X) = n/4. 


Exemple 3.3 


Le nombre N de boules rouges apparues au cours de n tirages avec remise 
dans une urne contenant deux rouges, trois vertes et une noire suit une loi 
binômiale B(n,1/3) : 


2 k 4 n—k Dn—k 
PA = 0 = (4) (à) (:) =) 0<k<n 


avec E(N)=n/3 et V(N) = 2n/9. 


— Remarques 


Si X, + Bn:,p) et X; — B(n,p), les va. X;, et X, étant indépen- 
dantes, alors X, + X, ++ B(n; + n,p). Ceci résulte de la définition 
d'une loi binômiale puisqu'on totalise ici le résultat de n; + n; épreuves 
indépendantes. 


Les tables de la loi binômiale ne sont fournies que pour p < 1/2. Pour 
une valeur p > 1/2, on utilise le résultat suivant : 


Px(X = E) = Pafn X =n—k) = (})ptQ = pt 


=(,74)0- ppt 


qui exprime que n—X --B(n,l — p), loi qui est tabulée puisque 
1—p<1/2. 
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oi hypergéométrique 


On effectue n tirages sans remise dans une urne contenant N objets dont N, 
objets À. On note X (w) le nombre d'objets À tirés à l'issue de l'événement élé- 
mentaire w. Les tirages successifs sont ici dépendants puisque la composition 
de l'urne est différente après chaque tirage, dépendant des tirages précédents. 
Dans le schéma binômial du paragraphe précédent on peut aussi considérer que 
l'on effectue n tirages avec remise dans une urne dont la composition est telle 
que N,/N = p. Les épreuves successives sont alors indépendantes. 


Dans le schéma hypergéométrique ici, ces n tirages sans remise sont équiva- 
lents à un seul tirage de n objets et il y a donc équiprobabilité de chacun des 
ee échantillons possibles. Pour calculer la probabilité d'obtenir k objets À il 
faut donc dénombrer tous les échantillons qui contiennent exactement k des N, 
objets À, il yen a We 


lyena (V7 74). 


) chacun d'eux contenant simultanément n — k objets À, 


— k 
N 
NN 
N, . 
n—k 
k 
Figure 3.3 
Ainsi, pour tout entier ktel queU<K<n: 
N,, N—N 
Px(X =k E Cr) 
n 


il faut bien entendu aussi que & < N, (nombre total d'objets À) et n —k < N — N, 
(nombre d'objets À ) d'où les conditions : 


max{0O,n—(N—N,)}<k< min{n, Ni}. 


Pour vérifier qu'il s'agit bien d'une loi de probabilité, on utilise le résultat sui- 
vant de combinatoire : 


AR 


74 e STATISTIQUE ET PROBABILITÉS 


© Dunod. Toute reproduction non autorisée est un délit. 


obtenu en effectuant le produit : 


Fr S r 


++ = (D (ee DDC) 


k=0 j=0 


et en identifiant avec les termes de : 


(A +x) = (Me 


m=—0 


On en déduit que > Ce )( a. ) 
k=0 


>. Px(X = k) = 1. La loi hypergéométrique dépend des trois paramètres N, n 


k=—0 
et N, et on écrit symboliquement X - H(N ,n,N). 


N : 
= ( ñ ) , ce qui permet de conclure que 


Pour calculer plus facilement les moments de cette loi, nous allons supposer 
que chacun des objets À est numéroté et nous allons leur associer une v.a. indi- 
catrice de tirage : 


1 si l’objet À; est tiré 


a Lo sinon 


, 1I<i<N,: 


Ces variables permettent d'écrire : 
NA 
ee 
i=1 


mais notons qu'ici les v.a. X; ne sont pas indépendantes. Elles suivent la même 
loi de Bernoulli dont le paramètre est la probabilité de tirage d'un objet À parti- 


culier. Chaque échantillon a la même probabilité 1/( » ) ; les échantillons qui 


contiennent l'objet À; sont au nombre de Le ) , donc : 


N-1 
Co 


On en déduit facilement que : 


NA 
EX) = DŸEG) = Nas = np 


i=1 
ayant posé p = P(A) = N,/N. 


Pour calculer V(X), il est nécessaire de déterminer la loi des couples 
(X;,X;) puisque ces variables ne sont pas indépendantes. Le nombre d'échan- 
à ; - ; 2 - = 2 
tillons qui contiennent simultanément les objets À; et A; est ous 2 ) , donc : 
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N —2 
n-2) n@-D 
N) N(N-1) 
(3) 


P(X;=1,X;= 1) = 


Ainsi : n(n — 1) 
ES 
et : 
n(n — 1) n° 
Cov(X;,X;) = E(X;X;) — E(X;)E(X;) = N(N-1) N2 
n(N —n) 
= — —— < 
N?(N = 1) 


Par conséquent : 


V(X) = v(>x) = SV) + X Coutx,X) 


iFi 
nN-n n(N —n) 
=Ny——— — NN, — 1) ———— 
AN UN ANA a D 


N—-n N\ N\ 
=n 1 
N-IiN N 
Soit en posant g=1-p=1-N;/N: 
N-1 
S1 la taille N de la population est grande vis-à-vis de la taille 7 de l'échan- 
tillon, on a l'approximation : 
N=n,  LEniN 
Nb LEUNe 


V(X) = npq 


et : 
V(X)  npq 


qui est l'expression de la variance de la loi binômiale B(n, p), c'est-à-dire du cas 
de tirages indépendants (cas limite d'une population de taille infinie). Pour n/N 
petit et N grand on peut utiliser la loi binômiale (plus simple) comme approxi- 
mation de la loi hypergéométrique (cf. chap. 6, $ I, |, 2). 


oi de Poisson 


Une v.a. X suit une loi de Poisson de paramètre À > 0 si c'est une variable à 
valeurs entières, X(Q2) = N, donc avec une infinité de valeurs possibles, de pro- 
babilité : 
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Af 

Px(X = Rk) = en: keN 
loi qui ne dépend que d'un seul paramètre réel positif, avec l'écriture symbolique 
X PQ). 


Le développement en série entière de l'exponentielle : 


ss 
pr 2 
permet de vérifier que : 
D Px(X=R)=1 
k=0 


On peut déterminer quel est l'entier le plus probable en formant le rapport : 
Px(X = k) ME (k—1)! À 

— X —= : 

Px(X=k-T) k! À k 


k2>1 


ce qui montre que pour tous les entiers k inférieurs à À on a Px;(X =Kk) > 
Px(X =k—1), donc P;(X = k) est croissant, puis décroissant pour les 
entiers & > À, le maximum étant atteint pour l'entier k = [À]. Pour [A] = 0, les 
valeurs de P;(X = k) sont décroissantes à partir de la valeur maximale qui est 
Px(X = 0). Dans le cas particulier où À est entier, il y a deux valeurs de pro- 
babilité maximale qui est P;(X = À) = P;(X = À — 1). 

Le calcul de l'espérance mathématique se déduit du développement en série 
entière de l'exponentielle : 


oo Ce) Af O0 A1 
: D Te — 


k=1 


Pour calculer la variance nous n'allons pas calculer E(X?) mais le moment 
factoriel E [X(X — 1)] qui s'obtient plus facilement, selon la méthode précé- 
dente : 


O0 L Le) Àf 
E[X(X—1)]= D &(&—1)P:(X =R)=e pri 0. 


k=0 


On en déduit : 
V(X) = E(X?) — E’(X) = E[IX(X — 1)]]+E(X) — EX) = À 
— Remarques 


Si deux variables suivent des lois de Poisson et sont indépendantes, 
X-- P(X) et Y -- P(u), alors leur somme suit aussi une loi de Poisson : 
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X+Y =PQA+u). 


Le moment factoriel d'ordre trois s'obtient aisément et permet d'en dédui- 
re le moment centré d'ordre trois : 


E[X(X — 1)(X —2)] = À = E(X*) — 3E(X?) +2E(X) 
d'où on déduit : 
us = EI[X — E(X)] = E(X?) — 3E(X?)E(X) +2E*(X) = À > 0 


donc loi dissymétrique à droite. 


oi géométrique ou de Pascal 


On effectue des épreuves successives indépendantes jusqu'à la réalisation d'un 
événement particulier À et on note X le nombre (aléatoire) d'épreuves effectuées. 
On définit ainsi une v.a. à valeurs entières de loi géométrique, ou de Pascal. 
À chaque épreuve est associé l'ensemble fondamental @ = {A,A} et l'événe- 
ment {X = k} pour k e N* est représenté par une suite de k — 1 événements À, 
terminée par l'événement À : 


A... AA 
—— 
k—1 


Si on pose p = P(A), la probabilité de cet événement est : 


Px(X =k)= (1 p}'p 


En utilisant la série entière hs = 1/(1 — x) pour |x| < 1, puis en déri- 
5 k=0 
vant, on en déduit D —=1/(1— x), ce qui permet de vérifier que 
_ k=1 
>. Px(X = k) = 1. Ceci permet également d'obtenir l'espérance : 


k=0 
[ee] u P 1 
EX) = D kpgi = = 
2 A—gY p 
où on a posé g = 1 — p. Le calcul de la variance se fait à partir du moment fac- 
toriel : " : 
E[X(X—1)]= D &&—1)pg"" = pq DK — Da“? 
k=2 k=2 
2pq _ 2q 


A-gÿ pp 
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d'où on déduit : 
q 


V(X) = EIX(X — 1)]+ E(X) — E°(X) = 7 


oi binômiale négative 


On effectue cette fois des épreuves successives indépendantes jusqu'à ce que n 
événements À soient réalisés et on note Y le nombre (aléatoire) d'épreuves effec- 
tuées. L'événement {Y = y}, pour tout entier y > n, est représenté par une suite 
de la forme : 


AAA...AA...AA 
mm, 


y—1 


qui comporte n — 1 réalisations de l'événement À au cours des y — 1 premières 
épreuves et qui se conclut par un événement À. On en déduit la probabilité indi- 
viduelle : 


— ] 
PŒ=»= (27) pp, yon 


Pour obtenir sans calculs les moments de Y, nous allons décomposer la suite 
des épreuves en ñn séquences se terminant toutes par un événement À, associant 
à chacune de ces séquences une v.a. de Pascal X;,1 <i < n, qui représente le 
nombre d'épreuves nécessaires pour que le i-ème événement À soit réalisé, en 
comptant à partir de la réalisation du précédent À : 


AA... AAAA...AA...AA...AA 
Se —— —  —— ——— — 


Xi X) Xn 


Ceci permet de définir la loi de Y, dite loi binômiale négative, comme somme 
de lois de Pascal indépendantes et de même paramètre p : 


Y=X, +...+X, 
On en déduit alors facilement : 


EX)=nEX)= 2 et V(Y)=nv(x) = 7 
P P 
Pour la loi binômiale, le nombre d'épreuves est fixé et on observe le nombre 
aléatoire d'événements réalisés. Pour la loi binômiale négative, au contraire, le 
nombre de réalisations d'événements est fixé et c'est le nombre d'épreuves 
nécessaires pour les obtenir qui devient aléatoire. 
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ois usuelles continues 


oi uniforme 


Une v.a. X suit une loi uniforme continue si sa densité est constante sur un inter- 
valle fini [a,b], étant donc de la forme : 


fQ) = e si xEe {a,b] 


sinon 


On écrit X - U([a,b]). Compte tenu du graphe de la densité, on appelle 
aussi cette loi distribution rectangulaire. La constante k doit être telle que 


+00 b 
f(x)dx = 1 soit kdx = k(b — a) = 1, ce qui impose k = 1/(b — a). 


—C 


La densité a pour valeur sur l'intervalle [a,b] l'inverse de sa longueur : 


f(x) = sn Vx e[a,b] 
b—a 


fa) À 


1/(b — a) 


Figure 3.4 


Déterminons la fonction de répartition de X : 


—SiX <a: 


F(G@) = Odt = 0 


O0 
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— Sib < x: 


# | # b—a 
F@= | Odt - Î dt + Î Odt — = Î 
us a b—a b b—a 


On obtient donc : 


0 Si x <a 
Xx—a 
F(x) = Aa Si a<x<b 
1 Si b<x 
F(x) À 


Figure 3.5 


Le fractile d'ordre p € ]0,1[, qui est défini par F(x,) = p, a pour valeur ici 
X) =a+(b—a)p. 

La densité est discontinue en a et b mais la loi est absolument continue et la 
fonction de répartition est bien sûr continue en ces points. 

Dans le cas particulier où a = 0 etbh=1,onaX + {U([0,1]) avec : 
si xe [0,1] 
sinon 


fo={, 


O0 si x <0 
F(x)= {x si O<x<l 
1 si 1<x 


La probabilité d'un intervalle [x,,x;] inclus dans [a,b] est proportionnelle à 
sa longueur : 


X2 1 X2 
Py(x, < X < x) = f(x)dx = —/ dx 
*1 b—a, 


X2 — Xi 


7 ba 


Calculons l'espérance : 


eco = f” = 1 [xx - 1 [x] b+a 
D OR rt aie A Mae 
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c'est-à-dire que le centre de la distribution est le milieu de l'intervalle, résultat 
prévisible puisque la loi est uniforme sur cet intervalle. Dans le cas particulier 
où a = 0 et b = 1 on obtient E(X) = 1/2. 


Calculons maintenant la variance : 


, PS ; 1 24 1 x? 
E(X°) = = —— = D 
CU | 


= SO + ab + a) 
D NZ 
VO = EG) — E2X) = À _ 


Donc V(X) = 1/12 dans le cas de la loi uniforme sur [0,1]. 


oi exponentielle 


La loi exponentielle de paramètre 4 > 0 est celle d'une variable positive de den- 
Sité : 


de * si 0O<x 
fa = {6 si x <0 


fax) À 


0 


Figure 3.6 


La variable associée X est souvent utilisée pour représenter une durée de vie 
(durée de vie d'un matériel donné, durée de chômage, durée d'hospitalisation - - .) . 
On écrit X -+ £(8). Sa fonction de répartition est bien sûr nulle pour x < 0, et 
pour x > 0 on obtient : 


F(x) _ o | e dt = [-e"l pe e®* 
0 
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F(x) À 


Figure 3.7 


On calcule l'espérance en intégrant par parties : 


+00 Es +00 1 
E(X) = o | xe dx = [-xe #T +[ e *dx = 2 
0 0 


On calcule de même, en intégrant par parties, le moment d'ordre deux : 


+00 AS +00 2 2 
E(X?) = o | je “dx= [re FT + 2) Le dr AL. Sr 
0 0 


d'où on déduit : 


1 
VO= 


oi normale ou de Laplace-Gauss 


C'est la loi d'une variable aléatoire X à valeurs dans R, de densité : 


(x — m) 
20? 


exp 


1 
er 


qui est définie par deux paramètres m et o > 0 dont nous verrons l'interpréta- 
tion un peu plus loin. On note X --N(m,o). Bien entendu, s'agissant d'une den- 
sité de probabilité, on en déduit la valeur de l'intégrale suivante : 


+00 
552 
1 e EP dx = o 27 
—CO 

Les remarques suivantes vont nous permettre de préciser le graphe de f. 
— Remarques 


1. On peut constater que f(2m — x) = f(x), ce qui indique que le 
graphe de f est symétrique par rapport à la droite verticale x = m. 
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; Î x—m ini Xx=Mm, Ï - 
2. L'expression ? est minimum pour ce qui va corres 
pondre à un maximum pour f de valeur : 


1 
ne 


3. Pour calculer facilement la dérivée, considérons : 
1 
In f(x) = —Ino 427 — ——(x — m)? 
20? 


D'où en dérivant : 


FO 
F@) 


Et en dérivant à nouveau : 


of") = — fx) + (m — x) fx) 


Le m) et o2f0) = (mn —x)f 
© 


d'où on déduit : 
d'f't)=m-2x)f@)=cft)=m-x-50v)Mm-1:+06)f@) 


donc f” s'annule en changeant de signe pour x=m—o et 
x = m +0, ce qui correspond à deux points d'inflexion pour le graphe 
de f. 


4. Enfin, quand x devient infini, alors f (x) — O0 donc l'axe des abscisses 
est asymptote au graphe. 


Toutes ces remarques permettent de tracer le graphe en cloche de la den- 
sité f. 


Figure 3.8 
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+00 
L'intégrale Î xf (x)dx est convergente en raison de la présence de l'ex- 


—00 
ponentielle, donc E(X) existe et sa valeur ne peut être que m en raison de la 
symétrie de la densité par rapport à cette valeur. Vérifions-le en écrivant : 


EG = | caroodx = ] Re. 


OO —00 


= nf” f(x)dx + ['e — m) f(x)dx 


OO 


=m+[ @- m)fGd» 


OO 


l'intégrande étant une fonction impaire de x — m = u, l'intégrale est nulle puis- 
qu'elle est convergente et qu'on intègre une fonction impaire sur un intervalle 
centré à l'origine. On retrouve bien l'interprétation du premier paramètre comme 
moyenne de la loi : 


E(X) = m. 


Pour calculer le moment d'ordre deux, on fait le changement de variable 
u=(x—-m)/0 : 


1 +00 _ 2 
E(X?) = Î x?exp — SU 


oV27 20? 


(o?u? + 2mou + m°}e "?du 


_. 
E NV 27 J-« 


que l'on intègre par parties : 


2 
ue" du + m° 


+00 
eve 52 +00 
hs V2x | V27 Î e"Pdu + m° = 0° + m° 


V(X) = 0° 


le second paramètre étant donc l'écart type o. On obtient aussi E(X — m)° = 0, 
comme d'ailleurs tous les autres moments centrés impairs qui sont nuls, et 
E(X — m)* = 30*. 


- Loi normale centrée réduite (loi normale standard) 


En faisant le changement de variable U = (X — m)/o, c'est-à-dire en centrant 
et en réduisant, on obtient une v.a. de loi standard, de moyenne nulle E(U) = 0 
et de variance unité V(U) = E(U?) = E(X — m)?/o? = V(X)/o?=1, 
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donc de densité : 


2 


1 
o(u) = et /2 
V27T 
+00 2 
On peut donc en déduire la valeur de l'intégrale Î e “du = V2x. 


On obtient les dérivées à partir du logarithme, Ing(u) = —In/27 — u°/2 : 
p'(u) = —up(u) et p'(u) = pu) — up'(u) = (° — Do(u) 


La valeur maximale de @ est @(0) = 1/27 = 0,3989 et les valeurs 
décroissent rapidement, avec par exemple @(2) = 0,0540 et w(4) = 0,0001. 


La fonction de répartition est définie par : 


D(x) = Pqu 


1 X 
——— e 
LE 
et n'est pas exprimable au moyen d'une fonction usuelle. Les valeurs de ® sont 
fournies dans les tables statistiques (table 1) pour x > 0. Pour x < 0, on utilise 
le fait que @ est une fonction paire, œ(u) = @(—u), c'est-à-dire que la loi est 
symétrique par rapport au centre de distribution 0, soit: P(U < —x) 
— P(U > x), ce qui se traduit pour la fr. par D(—x) = 1 — P(x). 


Figure 3.9 


De cette symétrie découle également la probabilité d'un intervalle centré à 
l'origine : 


P(IU| <a) = P(-a <U <a)=®D(a)—®D(—-a)=2®D(a)—-1, a >0 


Ceci permet par exemple de déterminer l'intervalle interquartile, c'est-à-dire 
l'intervalle centré à l'origine et qui contient 50 % de la masse totale. On doit 
trouver la valeur de a telle que P(IU]| < a) = 1/2, soit 2®(a) — 1 = 1/2 ou 
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(a) = 0,75. Il s'agit donc du fractile d'ordre 0,75 de la loi normale standard, 
dont la valeur est lue dans la table 2 des fractiles : a = Q3 — 0,6745 © 2/3. 
Rappelons que le fractile d'ordre p €]0,1[ est la valeur u, telle que (u,) = p, 
soit u, = ® '(p). De même, on peut calculer la probabilité P(|U| < a) des 
intervalles centrés à l'origine, pour les valeurs entières de a. Aïnsi: 
2d(1) — 1 = 0,68268, 2D(2) — 1 = 0,95450, 2D(3) — 1 = 0,9973 ; il n'y a 
pratiquement plus de masse de probabilité au-delà de la valeur 4 puisque : 
P(IU| > 4)=6 x 10°. La figure 3.10 ci-après synthétise ces résultats pour 
une loi quelconque, à partir de l'équivalence : 


—4 < <a$&m—-oa<Xx<m+oa 


2% 

—m-36 m—20 mo 3° m | Fo im+o m+20 M+30— 
ER E 

68 % 

95 % 

99,7 


Figure 3.10 


Pour déterminer les valeurs de la fr. d'une loi normale quelconque, on se 
ramène à la loi standard qui est tabulée, à partir de : 


X—-m X—m Xx—m 
FU) = PO <= P ( < }=r(v- ) 
o Oo 


ae) | 


+ Convolution de lois normales 


La convolution (somme) de deux lois normales indépendantes est encore une loi 
normale : si X --N(m:,01) et Y -=N(m:,02) sont des v.a. indépendantes, alors 


X+Y = Nm + m0? + oi). 
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oi gamma 


Une v.a. X suit une loi gamma de paramètres p > 0 et 0 > 0 si c'est une va. 
positive dont la densité est de la forme : 


gr 
fx)=——e t%*xr 1, x 2>0 


(p) 


la fonction gamma étant définie pour tout p > 0 par: 
+00 
F(p) = Î ex?" \dx 
0 


On écrit X ++ y(p,0). Parmi les nombreuses propriétés de la fonction l°, on 
montre en intégrant par parties que pour tout p > 1 : 


Cp) = (p—1)T(p —1) 
Donc, pour p entier strictement positif on en déduit que : 


F(p) = (p — 1)! 


Le calcul des moments s'effectue aisément par le changement de variable 


y = 0x: 
oP +00 1 +00 d 
E(X) = 1 exPdx = —— Î er y 
F(p) Jo F(p) Jo 0 
= PERD) 
7 0 T(p) 0 


P +00 1 +00 
E(X°) = 0 Î e *xPtlqx = Î y D 
lp) Jo lp) Jo 0 
1 T(p+2)_ pp+Dl 


07 T(p) C) 


P 
V(X) = œ 
Étudions la loi de la va. Y = OX : 
GO) = P(Y < y) = P(OX < y) = P(X < =) = F(2) 


où Fest la fr. de X ; la densité de Y est obtenue par dérivation : 


y OP , ne 


—_ =ÿ —_ 1 —y4,p—1 
rm He 


ESA 
PAT e — TE) 
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et on reconnaît la densité d'une loi y (p,1) que nous noterons simplement y (p). 
Les moments s'obtiennent à partir de ceux de X en faisant 0 = 1 : 


EY)=V®Y)=p 


On a donc les équivalences suivantes entre les lois gammas à 1 et 2 para- 
mètres : 


Y 
X-y(p0) = Y=0X-y(p) = Fer er 0 


* Convolution de lois gammas 


La convolution (somme) de deux lois gammas indépendantes est encore une loi 
gamma : si X -+y(p,0) et Y - y(g,0) sont des v.a. indépendantes, alors la v.a. 
somme X + Y + y(p + q,6). 

La famille des lois gammas contient comme cas particuliers deux lois usuelles, 
l'une déjà étudiée qui est la loi exponentielle de paramètre 9 > 0, obtenue pour 
p = 1 et qui est donc la loi (1,0) de densité 0e ** pour x > 0. Cette remarque 
peut être utile en statistique dans le cas de va. X,,..., X, indépendantes et de 
même loi exponentielle de paramètre 6, avec : 


n 
=) X;-y(n0) et 05, 7y(n) 
i=1 
La seconde est la loi du khi-deux, très utilisée en statistique et que nous allons 
étudier maintenant. 


oi du khi-deux 


La loi du khi-deux à n degrés de liberté, notée x?, est la loi y(n/2,1/2) où nest 
un entier positif, donc de densité pour x > 0 : 


—x/2xn/2-1 


1 
ET) 


Ses moments se déduisent de ceux de la loi gamma : 


2 ” 
EQD= En et VGD = PE = 2n 


—+ Remarques 


à 22 : ; 5 
En appliquant les équivalences ci-dessus entre lois gammas pour 0 = ;, 


on peut passer de la loi gamma non tabulée à la loi du khi-deux qui est 
tabulée : 


1 1 
ER CARTONS ve y(rs) = 
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Pour des v.a. exponentielles comme ci-dessus on en déduit 205, + x3,. 


Il existe également un lien avec la loi normale qui explique son importance 
en statistique. Si X > N(m,0o) alors : 


X-m\° 
( ) x? 
o 
En effet, la va. U — (X — m)/o suit une loi N(0,1) et si on pose Y = U?, 
sa f.r. est définie pour y > 0 par: 


GO) = PE < y) = PCF <U < V5) = ED - (VD 


et sa densité est donc : 


1 p (V5) ET 
3 le WW) +e(-vy)| = = 
c'est-à-dire, puisque F(1/2) = (/T, la densité d'une loi y(1/2,1/2) ou loi x?. 


Ceci permet notamment de retrouver l'expression du moment d'ordre 
quatre de la loi normale, puisque de V[(X — m)/o] =2 on en déduit par 
la formule développée de la variance E(X — m)* — E?(X — m)? = 20* puis 
EX -m) = 360"; 


+ Convolution de lois du khi-deux 


80) = 


La convolution (somme) de deux lois du khi-deux indépendantes est encore une 
loi du khi-deux : si X ++ x? et Y «= x? sont des v.a. indépendantes alors la v.a. 
X+Y = x?,,..1l s'agit simplement de la propriété relative aux lois gammas. 


n+m 

Des deux propriétés précédentes nous allons déduire une autre propriété qui 
indique comment s'introduit cette loi dans les échantillons gaussiens : si 
X:,...,X, sont des va. indépendantes et de même loi N(0,1), alors 
X?+...+ X° suit une loi du khi-deux à n degrés de liberté. Cette propriété 
pourrait d'ailleurs servir de définition de cette loi, sans référence à la famille des 
lois gammas. Le nombre de degrés de liberté correspond au nombre de variables 
indépendantes qui sont intervenues dans sa construction ; si ces variables étaient 
liées par k relations, le nombre de degrés de liberté serait alors ñn — k. 


oi bêta 
Il existe deux familles de lois bêtas qui se déduisent de la famille des lois gammas. 


1) Loi bêta de seconde espèce 


Si X et } sont deux v.a. indépendantes de lois respectives y(p) et y (q), alors la 
va. Z = X/Y suit une loi bêta de seconde espèce de paramètres p > 0 et 
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qg > 0, notée B;;(p,q), et de densité pour z > 0 : 


1 gr! 
Lo B(p,q) (1 + z)°+ 
Où : 
__ F(p)T (a) 
B(p,q) — T@+a) 


Des propriétés de la fonction [on déduit aisément les moments de Z': 


+00 2] PNlE EL 
E(Z) = 1 Î 4 ere LD p ei 
B(p,q) Jo (A +z})?t B(p,q) g—l 
E(Z9 = 1 14 gti = B(p +2,q — 2) 
B(p,q) Jo (A +z)?t4 B(p,q) 
_ p(p + 1) 
(g — 1)(g — 2)” : 
p(p +q— 
VA UE Re 2 
Sn 7 LE LS 


2) Loi bêta de première espèce 


La loi bêta de première espèce est également définie par un rapport de lois gam- 
mas ou à partir de la loi précédente ; c'est celle de la v.a. à valeurs dans [0,1] : 


— X : Z 
TRY TE Z 
sa densité pour 0 < r < 1 est: 
FG) = PU=DE 
B(p,q) 


on écrit T + B;(p,q). Notons que : 
1 
fran tar = 502) 
0 


On obtient comme moments : 


1 ; : B(p + 1,q) P 
E(T) = ——— P(1 — 1) dt = = 
M nn. Fe B(p,q) p+q 
1 
E(T?) ns PE =: 1) dt = B(p +2,q) = p(p GA 1) 
B(p,q) Jo B(p,q) (p+g)(p +q+1) 
V(T) = pq 


(p+qg)}(p+g+1 
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oi log-normale 


La v.a. positive X suit une loi log-normale de paramètres m et o > 0 si la va. 
InX suit une loi N(m,o) ; sa fr. vérifie donc pour x > 0 : 


InX — m +) 
<< 


F(x) = P(X < x) = P(InX < Inx) = | 
o o 


(==) 
pe 
o 


sa densité est donc pour x > 0 : 


1 Inx —m 1 1 
FO e( je (Inx — my 


% o oxV27r "de 


oi de Pareto 


C'est une loi qui est utilisée notamment dans la modélisation de la distribution 
des revenus d'une population ou en théorie des assurances. Sa densité est défi- 
nie pour x > xo > 0, x, pouvant s'interpréter comme le revenu minimum, en 
fonction d'un paramètre æ > 0 : 


fx) _ œ ET 


Xo X 


Compléments : fonctions génératrices 


La notion de fonction génératrice peut être utile parfois pour calculer plus facilement les 
moments de certaines lois de probabilité. 


onction génératrice d'une v.a. discrète positive 


Si X est une v.a. discrète positive dont la loi de probabilité est définie par l'ensemble des 
couples (xx, p4), où k parcourt un ensemble d'indices K € N, on peut définir sur [0,1] 
sa fonction génératrice par : 


Gx(u) = E (u*) = D pau 


keK 
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Pour 0 < u < 1, la série qui définit Gx est uniformément convergente puisque 


[pru*%| < p& et que > Px = 1. Par ailleurs, G x (0) = 0 et Gx (1) = 1. Un cas par- 
keK 

ticulier intéressant est celui d'une variable à valeurs entières, soit X (Q) = K C N, où 

G x est définie pour tout u € C tel que |u| < 1 par: 


Gx(u)=E (u*) = , peu 


keK 
Exemple 3.4 
Loi de Dirac (masse en a) : Gx (u) = u“. 
Exemple 3.5 
Loi de Bernoulli : Gx (u) = pu + q. 
Exemple 3.6 - 
Loi binômiale : G x (u) = >» (op A p}' uk = (pu + q)". 
k=0 

Exemple 3.7 ” à 
Loi de Poisson : Gx (u) = Del ut = eu) 

A : GX —= 2 a —= . 
Exemple 3.8 nu 2£ 
Loi géométrique : G x (u) = > pq" lu* = pu » (qu! = AE, 

k=1 k=1 l— qu 


Il y a une correspondance biunivoque entre loi de probabilité et fonction génératrice, 
due à l'unicité du développement en série entière de Taylor : 


@) 
Gx (u) = Ÿ_ pau = > Gx 0) u* 


! 
kEN kEN k' 


ce qui permet d'obtenir par exemple la loi de probabilité à partir de la fonction généra- 
trice, par les relations : 


Gx(0)=po et G$(0)=Kk!px pour ke N* 


Si X1,...,X, sont des v.a. mutuellement indépendantes, alors : 
n 
Gs. Le D = EG TE E( El u*) 
i=1 


= [I E(r)= [IGx (u) 
i=1 i=1 


Exemple 3.9 


La loi binômiale négative de paramètres n et p peut s'écrire comme somme de n 
lois géométriques indépendantes, donc, d'après l'exemple 3.8 : 
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a (2) 


La fonction génératrice est surtout utile pour déterminer les moments factoriels : 


ur =E[X(X—-1)...(X-k+1)], ke N* 


[ee] 
puisqu'on obtient ce (u) = Pr: G—1)...(Gj—k+D pjui* et par conséquent 
j=k 


G$ (D) = win. 
b Exemple 3.10 
Pour la loi de Poisson, Gx(u) =e*e" donc ei (u) = Xe *et et 
Mig = À”. 


La fonction génératrice des moments factoriels est donc définie par : 
00 u* 
Gx(1+u) = — 
x (1 +u) > HITS 
k=0 L 
La fonction génératrice des moments pour une v.a. discrète X est définie par : 
Hx Qu) = E (e*) = Gx(e") = D pre“ 
keK 


En développant en série entière e“*, on obtient en effet : 


oo  yk 00 À 
HrG)=E(e7)= ” TE (x°) = Dm 
4=0 À° k=0 ‘ 


d'où on déduit my; = E (X®) = H® (0) pour k € N*, avec mo = 1. 


b- Exemple 3.11 


Pour la loi de Bernoulli, Hx (u) = E (e"*) = Gx(e“) = pe" +1 — p, donc 
H® (u) = pe“ et my = p pour tout k € N*. 


B. Fonction génératrice d'une loi absolument continue 


La fonction génératrice des moments, pour une v.a. X de densité f, est définie par : 


+00 
Hx (u) = E (e“*) = Î ef (x) dx 
—O00 
lorsque cette intégrale généralisée existe. 
b Exemple 3.12 
SiX-€ (0) : 


+00 0 
Hx (u) = o | eU OX Gx =, pour u <0. 
0 Q u 
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Pour |u| < 0 on obtient donc : 


1 Liu AK! uk 
(DEEE ED ED 
. 1— u/0 0 Q F0 Q k! 
donc my = Fa pour tout k € N. 
Si X1,...,X, sont des v.a. mutuellement indépendantes, alors : 


Hx,+.4x, @) = E (er PE) = E(fLe*) 
i=1 


[LE (e"%) = [ [A Go 
i=1 i=1 


b Exemple 3.13 


Dans l'exemple 3.12, on a calculé la fonction génératrice des moments de la loi 
exponentielle de paramètre 0, qui est aussi la loi y (1,0). En additionnant p 
variables indépendantes de ce type, on obtient la loi y (p,0) dont la fonction 


génératrice est donc : 
1 P 
H — 
x (u) ( Fu ) 


La fonction génératrice des moments centrés est définie par : 


Mx Qu) = e7""1 Hx (u) = E [e“Xm] 


que l'on détermine à partir du développement en série entière : 


oo ,,k 
u(X mi) CPP: 
e DR Am) 
k=0 
pour obtenir : 
oo u* 
Heu 


qui permet de déduire les moments centrés à partir de cette fonction par : 


be = E(X mi) = M$ (0) 


b- Exemple 3.14 


Pour la loi exponentielle de paramètre 0 on a m1 = 1/0 et donc : 


se 1 Su qu 
ME Fée 2 mn *20) 
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On obtient ainsi : 


Exercices 


noncés 


Exercice n°1 


1) Vous effectuez un voyage en avion à bord d’un biréacteur qui peut poursuivre son vol 
avec un seul réacteur qui fonctionne. Les réacteurs fonctionnent de façon indépendante 
et ont chacun une probabilité p de tomber en panne au cours du vol. Calculer en fonction 
de p la probabilité x; que votre vol ait pu se poursuivre jusqu’à sa destination. 


2) Dans le cas d’un quadriréacteur, qui peut poursuivre son vol avec au moins deux réac- 
teurs qui fonctionnent, calculer en fonction de p la probabilité x, que votre vol ait pu se 
poursuivre jusqu’à sa destination. 


3) Pour quelles valeurs de p le biréacteur est-il plus sûr que le quadriréacteur ? Calculer 


TB Et To pour p = 5: 


Exercice n°2 


Au casino, un joueur décide de miser sur un même numéro (ou série de numéros), jus- 
qu'à ce qu'il gagne. Sa mise initiale est a > 0, le numéro qu'il joue a la probabilité p de 
sortir à chaque partie et il rapporte k fois la mise, k € N*. Calculer l'espérance mathé- 
matique du gain G de ce joueur qui double sa mise à chaque partie. 


Exercice n°3 
Une urne contient une boule blanche et une boule noire. 


1) On effectue des tirages avec remise jusqu'à obtention d'une boule blanche. Déterminer 
la loi de probabilité du nombre N de tirages, puis calculer E(N) et V(N). 


2) Mêmes questions si on remet une boule noire en plus après chaque tirage d'une boule 
noire. Calculer alors P(N >n), ne N*. 


Exercice n°4 


Vous avez besoin d’une personne pour vous aider à déménager. Quand vous téléphonez 
à un ami, il y a une chance sur quatre qu’il accepte. Soit X la variable aléatoire qui repré- 
sente le nombre d’amis que vous devrez contacter pour obtenir cette aide. Déterminer la 
loi de probabilité de X puis calculer P(X < 3) et E(X). 


Exercice n°5 


Lors d’un examen oral, on vous demande de tirer les trois sujets que vous aurez à traiter 
dans une urne qui en contient dix. Parmi ces dix sujets, il y en a 3 que vous ne connais- 
sez pas. Soit X la variable aléatoire qui représente le nombre de sujets qui vous seront 
inconnus à l’issue de ce tirage. Calculer les probabilités des différentes valeurs possibles 
de X et en déduire E(X). 
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Exercice n°6 


Pour être sélectionné aux Jeux olympiques, un athlète doit réussir deux fois à dépasser 
les minima fixés par sa fédération. Il a une chance sur trois de réussir à chaque épreuve 
à laquelle il participe. On note X la variable aléatoire qui représente le nombre 
d’épreuves auxquelles il devra participer pour être sélectionné. 


1) Déterminer la loi de probabilité de X. 

2) Si cet athlète ne peut participer qu’à quatre épreuves maximum, quelle est la probabi- 
lité qu’il soit sélectionné ? 

Exercice n°7 

Soit X une v.a. de loi binômiale de paramètres n = 20 et p = 0,1. 


1) Calculer les probabilités suivantes : P(X = 5), P(X < 2),P(X < 4),P(X =1,5), 
PG<X<4etP(2<X<3). 

2) Déterminer les valeurs de x telles que P(X > x) < 0,75. 

3) Calculer P(X = 16) dans le cas où p = 0,9. 


Exercice n°8 
Si X est une va. de loi de Poisson de paramètre À = 5, calculer les probabilités 


P(X = 6),P(X <4),P(X >5) et P(x/2 < X < 27) puis déterminer les valeurs 
de x telles que P(X < x) > 0,95. 


Exercice n°9 


Un commentateur sportif affirmait que le gain du match de double en coupe Davis (évé- 
nement noté D), était généralement synonyme de victoire. Le pays gagnant est celui qui 
remporte le plus de matchs, la rencontre comportant 4 matchs en simple et un match en 
double. On fait l'hypothèse que pour ces 5 matchs chaque pays a la même probabilité de 
l'emporter. Déterminer la loi de probabilité de la v.a. X qui représente le nombre de matchs 
gagnés par une équipe. En déduire la probabilité que le pays gagnant ait effectivement 
remporté le match de double. Calculer alors la probabilité qu'un pays ait remporté le 
match de double, sachant qu'il a gagné. Que penser de l'affirmation de ce commentateur ? 


Exercice n°10 

Si U est une v.a. de loi normale standard, calculer P(U < —2),P(—1 < U < 0,5) et 
PU > —3) puis déterminer ug et vo tels que P(IU| <uo) —=0,82 et 
P(U < —vo) = 0,61. 

Exercice n°11 

Soit X une v.a. de loi normale telle que P(X < 3) = 0,1587 et P(X > 12) = 0,0228. 
Calculer P(1 < X < 10). 

Exercice n°12 

Si X est une v.a. de loi normale telle que P(X < 2) = 0,0668 et P(X > 12) = 0,1587 
calculer la valeur de a telle que P {[X — E(X)Ÿ < a} = 0,95. 

Exercice n°13 

Une v.a. X suit une loi uniforme dans l'intervalle [0,1]. 


Exprimer la probabilité que X appartienne à l'intervalle [x1,x2] en fonction des réels x: 
et x) tels que x] < x2. 
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Exercice n°14 
Soit X une variable aléatoire dont la densité a pour expression, pour x > 0 : 
1 (In x)? 
f(x) = exp avec 0 > 0 


xV270 20 


Déterminer la loi de probabilité de la variable aléatoire Y = In X. 


Exercice n°15 


Soit X une variable aléatoire dont la densité a pour expression, pour x > À : 


et nulle sinon, où 6 et À sont deux réels strictement positifs. 

1) Calculer E(X) et V(X) puis déterminer la fonction de répartition F de X. 

2) Déterminer la loi de probabilité de la v.a. m, = min{X,,...,X,}, où X1,...,X, sont 
des v.a. indépendantes et de même loi que X. 

Exercice n°16 

Si T est une v.a. positive représentant une durée de vie, on dit qu'elle vérifie la propriété 
de non-vieillissement si pour tout { > 0 eth > 0: 


PT>t+hT>t)=P(T>h) 


Montrer que la loi de Pascal et la loi exponentielle de paramètre 0 > 0 vérifient cette pro- 
priété, c'est-à-dire sont des lois sans mémoire. 
Exercice n°17 


Si F et f sont respectivement la f:r. et la densité d'une v.a. positive, on désigne par taux de 
panne la fonction h définie pour x > 0 par : 


0) 
PE rre 


Déterminer cette fonction h pour la loi exponentielle de paramètre 0 > 0 et pour la loi 
de Weibull de densité f(x) = a0x%=lexp(—0x*) pour x > 0, où æ& et @ sont deux 
paramètres positifs. 

Exercice n°18 


Calculer l'espérance et la variance d'une loi log-normale de paramètres m et o > 0. 


Exercice n°19 


Soit X1,...,X, des v.a. indépendantes de densité f et de f:r. F. Déterminer les fr. puis 
les densités des va. m, = min{X;/1<i<n} et M, =max{X;/1<i<n)}. 
Appliquer ce résultat au cas particulier de la loi uniforme sur [0,1], puis calculer dans 
ce cas E(m,) et E(M,). 
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Exercice n°20 


Déterminer les moments non centrés d'ordre k, k € N*, de la loi de Pareto de para- 
mètres & > 0 et xo > 0. 


orrigés 
Exercice n°1 


1) On note P; l'événement « le réacteur À est tombé en panne au cours du vol », avec 
i = 1,2. On obtient : 


= P(PRNP)=1-P(ANP)=1- pe 
2) Le nombre de réacteurs qui tombent en panne au cours du vol est une variable aléa- 
toire X qui suit une loi binômiale de paramètres 4 et p. Ainsi : 
fo = P(X <2)=1-—P(X=3)-P(X=4)=1-4p(1—p)-p" 
=1—4p +3p* 
3) On obtient : 
To — 78 = p(1— p}(1 —3p) 


donc le biréacteur est plus sûr que le quadriréacteur pour p > 1/3. 


HiubRe 1\ 12 1). 11 
n VÊrITE QUE Tz 2 sr 2 nr. 


Exercice n°2 


Si N est le nombre de parties jouées, l'événement {N = n},n € N*, signifie que le 
joueur a perdu les n — 1 premières parties et que son numéro est sorti à la dernière ; cette 
v.a. suit donc une loi de Pascal de paramètre p : 


P(IN=n)=(1-p}"!'p 


À l'issue de ces n parties, le joueur reçoit k fois sa mise, soit k2"—la, après avoir misé au 
cours de ces parties: a+2a+2a+...+2"-la=a(i+2+2+,,.+9"0 
= a (2" — 1). Son gain est alors : g, = k2"-la — (2 — 1)a=a+(k—2)2" la. 


L'espérance de gain est donc : 


E(G)= D &P(N=n)=a+&— ap} 2" "(1 p 
n=1 n=1 


a+ (&—2)ap D Cg) 
n=1 


où on a posé g = 1 — p.Si g > 1/2, la série est divergente et cette espérance est infi- 
nie. Si g < 1/2, c'est-à-dire p > 1/2, on obtient : 


Ép=1 
O4 0er EP, 
1—2qg 2p—-1 


Pour k = 2 par exemple, E(G) = a, c'est-à-dire que l'espérance de gain du joueur est 
égale à sa mise initiale. 
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Exercice n°3 


1) Les tirages sont effectués jusqu'à ce que l'on obtienne une boule blanche, donc la 
variable N suit une loi de Pascal de paramètre p = 1/2 puisque c'est la probabilité de 
tirer une boule blanche : 


1 


D'après les résultats du cours : E(N) = V(N) = 2. 


2) Si on note respectivement B; et N; les événements tirer une boule blanche et tirer une 
boule noire au i-ème tirage, à € N*, la loi de la variable entière N est définie par : 


1 
P(N=D=P(BD)=; 


P(N=2)= P(N;B:) = = x 


DIR 
DO] 


n—1 1 1 


P(N=n)=P(N...Ny-1B%) = à at con 


2 
X LU 
3 


Ainsi : 


Bone + Dr = DE 
—_— n = 

2 = nm+l n 
série harmonique divergente, donc l'espérance est infinie. À fortiori la variance n'existe 


pas non plus. 


On obtient : n 
P(N>n)=1-P(N<n)=1-Ù P(N=E) 
k=1 
ET 1 1 
= | »( )- 
2 Zik k+1 n+1 


Exercice n°4 


La v. a. X suit une loi géométrique (de Pascal) ; pour tout entier k > 1 : 
On obtient ensuite : 


Le paramètre de cette loi est 1/4 donc E(X) = 4. 


Exercice n°5 


La v. a. X suit une loi hypergéométrique ; pour tout entier 0 < k < 3 : 


(3) 
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On obtient ensuite : 


1 1 3 1 
PX=O=E PX=D=; PX=D=S PX=D= 


2 10 30 
os eur ; = 1,2 
72 5 10 
En utilisant la formule du cours on retrouve E(X) = 3— — 1,2. 


10 
Exercice n°6 


1) I s’agit de la loi binômiale négative ; pour tout entier k > 2 : 
k—2 


2 
PX=D=GR- 1 


2) La probabilité d’être sélectionné est : 


Exercice n°7 


1) Par lecture de la table 3 on obtient: P(X = 5) = 0,0319,P(X < 2) = 0,6769, 
P(X <4)=0,8670,P(X =1,5)=0,P(<X<4)—0,2799 et P(2<X<38) 
= 0,9999 — 0,6769 = 0,3230. 


2) La condition P(X < x) > 0,25 équivalente à P(X < x — 1) > 0,25 conduit à 
x—1>loux2>2. 


3) Si X — B(n,p) on a P,(X = x) = (hr Gp} et P(X=n-x) 
— de ‘ Nip (1 — p)' = (Je (1 — g)" "où on a posé g = 1 — p. Par conséquent 
P,(X =x) = Pi_,(X =n-—x), soit en appliquant ce résultat: Po9(X = 16) 
= P51(X = 4) = 0,0898. 


Exercice n°8 


Par lecture de la table 4 on obtient: P(X = 6) = 0,1462, P(X < 4) = 0,2650, 
P(X 25) =0,5595 et P(x/2 < X < 2x) = P(X < 6) — P(X < 1) = 0,7218. On lit 
P(X < 10) = 0,9682 donc x > 10. 


Exercice n°9 


La va. X suit une loi binômiale de paramètres 5 et 1/2. Un pays est gagnant si X 23 ; 
la probabilité demandée est donc : 


5 5 
FIDAXE = Pb =b}=Y PA=DPIDILEE) 
k=3 k=3 


Si un pays a gagné k matchs, tous les choix parmi les cinq rencontres sont équiprobables, 
donc : 


Le) 
eo 


P{DIX=Kk}=— 
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Ainsi : 


5 5 4 
Pphna >= 3 DD rai 


On en déduit : 


P{DN(X>3)} 11/2 11 


P(X>3) 1/2 16 


P{D|IG}= 


L'affirmation de ce commentateur paraît fondée puisque cette probabilité est supérieure 
à 1/2. Cependant, s'il affirmait que le gain du premier match en coupe Davis est généra- 
lement synonyme de victoire on obtiendrait la même probabilité. C'est le fait d'avoir 
emporté un match (quel qu'il soit) qui renforce évidemment la probabilité de gagner ! 


Exercice n°10 


Par lecture des tables 1 et 2 on obtient : P(U < —2) = 1 — (2) = 0,0228, 
P(—-1<U <0,5) = (0,5) — [1 — d(1)]= 0,6915 — 0,1587 = 0,5328, 
PU > —3) = 1 — D(—0,75) = D(0,75) = 0,7734 ; 

P(IU| < uo) = Duo) — P(—uo) = 2 (uo) — 1 = 0,82 d'où D(uo) = 0,91 
et uo = 1,3408 ; P(U < —vo) = D(—v0o) = 0,61 et vo — —0,2793. 


Exercice n°11 


Nous allons d'abord déterminer les valeurs de m = E(X) eto = 4/V(X). La premiè- 
re valeur étant inférieure à 0,5 on considère son complément à 1, soit ici 
1—0,1587 —0,8413, valeur dans la table 1 de (1). De même 


1 — 0,0228 = 0,9772 = (2). En centrant et réduisant on a donc : 


X—-m 3—m 
r( < : es D(1) = D(—1) 


(ox 


(= 12—m 
P < 
o 


)-v0 


soit : 


ce qui conduit à m = 6 eto = 3, puis : 


5 X—-6 4 
PAU<X<10)=P < < 
3 3 3 


= (1,33) — [1 — D(1,67)] = 0,8607. 


Exercice n°12 


Dans la table 1 on constate que 1 — 0,0668 = 0,9332 = D(1,5) donc P(X < 2) — 
D(—1,5) ; de même 1 — 0,1587 = 0,8413 = (1). Donc en centrant sur E(X) = m 
et réduisant par /V(X) = © : 
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X—-m 2—m 
1 < }-® 1,5) 
© 


X—-m 12—m 
1 < }= ec 
oœ 


m _ 
soit = —1,5 et = 1 d'où m—8 et o —4. On sait que la va. 


X—m : : : 2 2 : 159 
suit une loi x; donc a/o” est le fractile d'ordre 0,95 de cette loi x, lu 


© 
dans la table 5, soit a/o? = 3,841 et a = 61,44. 


Exercice n°13 


Si f est la densité de cette loi uniforme, cette probabilité se calcule par : 


2x2 
Fete - | fOat 


La densité a pour valeur 1 dans l'intervalle [0,1] et 0 en dehors. La valeur de p est donc 
égale à la longueur de la partie commune des intervalles [0,1] et [x1,x2]. Elle est indi- 
quée dans le tableau suivant, en fonction de la position de x, et x: : 


X2 <0 | x) <0O<x) <1 | x, <O<1<x, | O<x;, <x <1 | 0O<x  <1<x | 1 < x; 


0 X2 1 X2 — X] 1 — x 0 


Exercice n°14 
La va. Y a pour fonction de répartition : 

G(y) = P(nX < y) = P(X <e’) = F(e) 
où F est la f.r. de X. La densité obtenue par dérivation est : 


2 
Exp — — 


1 
V2x0 20 


qui est la densité de la loi normale centrée de variance 0. 


g0) = e f(e) = 


Exercice n°15 


X—X 
1) On détermine la fr. de la v.a. U — re : 


G(u) = P(U <u) = P(X < Ou + À) = F(Ou + À) 
où Fest la fr. de X. Par dérivation on obtient la densité de U : 


g(u) = 6f (Ou + à) = e" 


u 


pour u > 0. C’est donc la loi exponentielle avec G(u) = 1—e" pour u > 0, et 
E(U) = V(U) = 1. On en déduit E(X) = 0 + À, V(X) = 0? et pour x > À : 
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Fa = 6 (2) =: exp ( >) 


2) La va. m, a pour fonction de répartition : 


H(y) = P(m, so=i-r ff > ») =l-[1-Fo)r 


i=1 


Sa densité est donc : 


= 
HO) = nl = FOSC) = à exp (-" a ) 


pour y > À. 


Exercice n°16 


Pour la loi de Pascal on a pour ft € N : 


OO O0 O0 t 
PT >= PT=b=pN gt = pq N gt = EE =4 
KI k=T 1 k=0 —4 


Par conséquent, pour h € N : 

P{T>t+hHO(T >}. PT >t+h) 
PT >?) PTE T 

=q"=P(T >h) 


PT >t+hIT > 1) = 


ce qui établit que c'est une loi sans mémoire. 


Pour la loi exponentielle de paramètre 0, on a pour t > 0: 


+00 
PTEDS= (l 0e ax = [-e #1 = 6% 
t 


L 


d'où pour h > 0: 


PÉTER). 0 70 
PT >t) et 


PT >t+hIT >1t) = =e "= P(T >h) 


ce qui prouve la propriété de non-vieillissement. 


Exercice n°17 


—0x 


La fr. de la loi exponentielle vérifie 1 — F(x) = e ** pour x > 0, donc: 


0 —0x 
RG) = = 6 
= 


x 


la loi exponentielle est à taux de panne constant, en plus d'être sans mémoire comme 
nous l'avons vu dans l'exercice précédent. 


Pour la loi de Weibull, si x > 0 : 


F(x) = f agile dt = [exp (—01°)], = 1 —exp(—0x") 
0 
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et : 
h(x) = «0x7! 


on retrouve bien le résultat obtenu pour la loi exponentielle en faisant & = 1. 


Exercice n°18 


On calcule l'espérance de X de loi log-normale de paramètres m et o en faisant le chan- 
gement de variable y = Inx : 


E(X) = L ‘ Exp — que — m) dx 
o 2x Jo 20? 

= L [ e’exp — et — m) dy 

© 27 —00 20? 
— L ae [y 2 26m + 02)y + n°] dy 

OV27T J- 20? 

1 1 2,2 2 5 1 2,12 

= sv (5 [Gm + o ÿY —m 1 exp — il-Um+a )] dy 


1 1 
—— €x gs mot + a) o V2 = exp(m + o°/2) 
oV2x : 20? : | 


On obtient de la même façon : 


E(X?) = exp (2m + 20°) et V(X) = (e° — l)exp (2m + 0°) 


Exercice n°19 


Pour déterminer la fr. de m,, on considère l'événement : 
n 

{mn > 3} = (EX > y} 
i=1 


De même, pour que M, soit inférieur à z il faut et il suffit que tous les X; soient infé- 
rieurs à z, ce qui s'écrit : 


On en déduit, du fait de l'indépendance des X; et de l'identité de leur loi : 
G6)= Pom <n= 1 Qu >] = 1-0 ro 
i=l 


n 
H() = PM, < 2) =] [P(X < 2 = FC) 
i=l 
Les densités correspondantes s'obtiennent par dérivation : 


GO) =nf@)l1- FONT 
h() = nf(@)F"7"Q) 
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Dans le cas particulier de la loi uniforme sur [0,1], on obtient : 


GH)=1-(1-7) et g)=n(i-y}"!, 0<y<1 
H(G)=2 et h() =n7"!, 0O<z<1 


On calcule alors l'espérance : 


1 1 
E(ms) = | vA— y)" dy = | (—u)u"-tdu 
0 0 


1 1 n 1 
=n [ atdun | u"du = 1 — = 
0 0 n+l n+l 


obtenue en faisant le changement de variable u = 1 — y. De même : 


n 
n +1 


E(M,) = nf za = 
Remarquons ici que : ‘ 
GO) = Pin, <y)=1-H(-7y)= PM >1—7y)= PA -M, < y) 
ce qui montre que les va. m, et 1 — M, ont la même loi de probabilité et donc que 


E(m,) = 1— E(M,). 


Exercice n°20 


Le moment non centré d'ordre k de la loi de Pareto de paramètres & et xo est : 


xtra 7 œ 
xf a la x = aXG | — = = ÿÀ 
k—-a ” œ—k 


+00 
k a 
E(X") = ax, Î 
x0 
à condition que k < œ. Seuls existent les moments d'ordre inférieur à œ. Par exemple, 
pour & = 2, la loi admet une espérance mais pas de variance. Pour & > 2, on obtient : 


æ 2 


"PT e-ve-n" 


106 e STATISTIQUE ET PROBABILITÉS 


© Dunod. Toute reproduction non autorisée est un délit. 


ouple 
et vecteur aléatoires 


omme nous avons associé un nombre à une expérience aléatoire, 

dans certains cas nous pouvons être amené à en associer plusieurs. 

Par exemple, le jet de deux dés distincts ne peut pas être codé avec 
une seule valeur numérique. De même, à un individu d'une population 
donnée, on peut associer son revenu et sa consommation. On est alors 
amené à associer à de telles épreuves aléatoires deux, voire plusieurs 
valeurs numériques, au moyen donc de plusieurs applications qui seront 
des v.a. pouvant être regroupées dans un vecteur, ce qui conduit à la 
généralisation en multidimensionnel de la notion de variable aléatoire 
réelle : un vecteur aléatoire. Pour la commodité de l'exposé nous com- 
mencerons par étudier le cas bidimensionnel, celui d'un couple aléatoire, 
en distinguant toujours les cas discret et continu. Nous verrons ensuite 
comment se généralisent les moments associés à un vecteur aléatoire et 
présenterons deux lois particulières, la loi multinomiale et la loi normale 
vectorielle. 


Objectif du chapitre : généraliser les notions de variable aléatoire, d’espé- 
rance et de variance au cas multidimensionnel ; définir les lois 
conditionnelles, la fonction de régression et la convolution de 
deux lois. 

Concepts clés étudiés : loi marginale, loi conditionnelle, régression, 
convolution, covariance, indépendance, matrice de variances- 
covariances. 
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ouple de v.a. discrètes 


oi d'un couple 


Un couple de v.a. discrètes est constitué de deux v.a. discrètes X et Y dont l’en- 
semble des valeurs possibles peut s’écrire respectivement sous la forme {x;};er 
et {y;hjes, où 1 et J sont des ensembles d’indices inclus dans N, pouvant 
d’ailleurs être N tout entier. On convient de ne faire figurer que des valeurs de 
probabilité strictement positive. Comme dans le cas unidimensionnel, la loi d’un 
couple discret est définie par l’ensemble des valeurs possibles, soit ici 
{(xi,y;) : Gj)eEelx J} , et par les probabilités associées : 


Pi = Pan (X =x,Y = j;) 


ois marginales 


À la loi d’un couple sont associées deux lois marginales qui sont les lois de cha- 
cun des éléments du couple pris séparément, définies par l’ensemble des valeurs 
possibles et les probabilités associées obtenues par sommation, soit : 


Px (X = x;) = D Pan (X = x, Ÿ = y) _ D» — Pi. 


EU jeJ 
Py (Y = y) = >» Par (x = x, Ÿ = »;) — D pP: nn. 
iel iel 


S1 la loi du couple est présentée dans un tableau, ces lois sont obtenues dans 
les marges, par sommation de ligne ou de colonne. 


De 7 
ÿ dump |, 
V 
Pi. — 1 


ois conditionnelles 


On peut également associer deux lois conditionnelles à la loi d’un couple, c’est- 
à-dire la loi d’une variable, l’autre ayant une valeur fixée (loi dans une ligne ou 
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dans une colonne donnée). Par exemple, pour Y = y; fixé, la loi conditionnelle 
de X est définie par l’ensemble des valeurs possibles et les probabilités asso- 


ciées : 
P(Y=)») RL 


on vérifie que c’est bien une loi de probabilité sur Qx = {x;; i € 1}: 


PS =r)= 


Exemple 4.1 
La loi d’un couple (X,Y) est donnée par le tableau suivant : 


Pl 22 à à 
— 1 0,1 0,2 0,1 0,4 
2 0,2 0,2 0,2 0,6 
0,3 O4 0,3 1 
La loi conditionnelle de X pour Y = —1 figure dans le tableau ci-après : 
XI? = -1 —2 0 2 


Rappelons que les deux v.a. X et Y sont indépendantes si pour tout à € J et 
tout j € J': 
P(X=x,Y = y) = P(X=x)PE = };) 


Dans ce cas, bien entendu, les lois conditionnelles sont confondues avec les 
lois marginales ; par exemple : 
TETENET EEE 
À 


Pi. 


C’est l’un des seuls cas où la donnée des lois marginales permet de recons- 
tituer la loi du couple. 


Couple et vecteur aléatoires e 109 


oments conditionnels 


Aux lois conditionnelles sont associés des moments conditionnels, comme par 
exemple l’espérance conditionnelle de Y pour X = x; fixé, qui est l’espérance 
de la loi définie par les couples {O:pi) JE J} , Soit : 


EUX =x)=N MP(Y=yX=x)=N yp 
jeJ jeJ 
Le graphe de cette espérance conditionnelle en fonction de x; s’appelle cour- 


be de régression (non linéaire) de Y en X. 


Exemple 4.2 


Dans l’exemple 4.1 précédent, la loi conditionnelle de Y pour X = 2 est 
donnée par le tableau suivant : 


YIX =2 — 1 2 
0,1 0,2 1 
0,3 0,3 


On peut calculer, à partir de ce tableau, l'espérance conditionnelle : 


1 2 
E(FIX=2=(-Dx3;+2x7=1 


Notons que E (Y]|X) est une fonction de X, donc une variable aléatoire dis- 
crète dont la loi de probabilité est définie par l’ensemble des valeurs possibles, 
soit ici {E (YIX = x;);iel}, et les probabilités associées p; = P (X = x;). 
On peut donc calculer la valeur moyenne de cette v.a., soit : 


E[EIXN= D nETIX=x) 


iel 


=Ù Un D MP(Y=yIX= 7x) 


iel jeJ 

— ” Pi. + YiP; — > . Y;Pi. Pi = > Y; s Pij 
iel jeJ iel jeJ Pi. jeJ iel 

= D Ps 
jeJ 

= E(Y) 
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On peut également calculer la variance conditionnelle : 


VŒIX=x)=E{F-EFIX=x)lIX = x} 
= E(Y°IX = x;) — E°(YIX = x) 
=D pin -EWIX=x)} 


jeJ 


On peut établir que la variance totale de Y peut se décomposer à l’aide de ces 
deux premiers moments conditionnels : 


V®Y) = EIV YIX)1+ VIE (FIX)] 


oments associés à un couple 


Si h:R? — R est une application continue, elle définit une variable aléatoire 
réelle dont on peut calculer les moments, comme par exemple l’espérance : 


ElR(XYN = NN pyh(x.y;) 
iel jeJ 
Dans le cas particulier où h(X,Y) =[X — E(X)][Y — E(Y)] on définit 
ainsi la covariance de X et Y : 


Cov(X,Y) = E{[X — E(X)I[IY — E(Y)]} = E(XŸ) — E(X)E(Ÿ) 


Nous avons vu dans le chap. 2, $ IL D, 2 que si les v.a. X et Y sont indépen- 
dantes, alors E(XY)= E(X)E(Y) et par conséquent Cov(X,Y) = 0. 
Cependant, il faut faire attention au fait que la réciproque est en général fausse, 
c’est-à-dire que si la covariance de deux v.a. est nulle, elles ne sont pas forcé- 
ment indépendantes. 


Exemple 4.3 


Considérons le couple (X,Y) dont la loi est définie par le tableau ci- 
après : 


val ef où 1 
ii 1/8 1/8 1/8 
0 1/16 1/8 1/16 
1 1/8 1/8 1/8 


Couple et vecteur aléatoires e 111 


Les lois de X et Y sont symétriques par rapport à 0, donc E(X) = 


E(Y) = 0 et: 
1 1 1 1 
Cov(X,Y) = E(XY)=1 x st 1) x st ( 1) x sl x 0 
et cependant ces deux variables ne sont pas indépendantes puisque par 
exemple : 


P(X=-1,Y —-1)=1/8# P(X = —1)P(Y = —1) = 5/16 x 3/8. 


On appelle coefficient de corrélation linéaire de deux v.a. X et Y le nombre 
Fe DE Co QE) = 
| VV) VV) 
c’est un nombre tel que —1 < p < 1, avec: 
lb=l1& ER, ER: Y=aX+b 


c’est-à-dire qu’un coefficient de corrélation de valeur absolue égale à un est l’in- 
dication d’une liaison affine entre les deux variables. 


oi d'une somme 


Si À et Y sont deux v.a. discrètes de lois respectives {(x;,p;);i e 1} et 
{(:,4:) JE Th la va. Z = X + Y est aussi une v.a. discrète dont la loi de 
probabilité est définie par l’ensemble des valeurs possibles, soit ici 
{(x + y) :1Ee1,jE J} , et les probabilités associées : 


PZ=w)=N {P(X=x,Y=y)/x+y=4} 
Dans le cas général cette loi ne peut donc être définie que par la donnée de 
la loi du couple (X,Y). 
+ Cas particulier : X et Y sont indépendantes. 
On parle alors de convolution des lois de X et Y, qui est définie par : 
PA==) PA=mPPES x) 
iel 
=Ù P(Y=)P(X=x-);) 
jeJ 
En général, beaucoup des termes des sommations précédentes sont nuls car 
il faut tenir compte des restrictions 24 — x; € Qy — V5 j € J} et 
Z — VE Qx ={x;iel}. 
Exemple 4.4 
Convolution de deux lois binômiales. 


Soit X et Y deux va. indépendantes, de lois respectives B(n;,p) et 
B(n,p). La va. S = X + Y est à valeurs dans Qs = {0,1,...,n; + m} 
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avec pour 5 € Qs : 


S$ 


(S=s)=U{X=0Nn%=5s-x) 
Ainsi : ds 


POSSHE=DPA=NET = 
—=0 
- n ss à n SX 9 —ST+X 
be) 
D X $ — X 


S ,n n)—S ) ni M ni “ m2 S Jr n9 —S 
NL) NX s 


ce qui indique que S = X + Y suit une loi binômiale B(n; + n:,p). Le 


résultat : 
5 ni M \_fmt+tm 
NAN EX s 


exprime que le nombre de sous-ensembles de s éléments extraits d’un 
ensemble comportant n; éléments d’une sorte et n; éléments d’une autre 
est obtenu à partir des sous-ensembles associés de x éléments de la pre- 
mière sorte et de s — x éléments de l’autre, avec x variant de 0 à s (voir 
figure 4.1). 


NN 


4 


4) > 
WU 
es 


Figure 4.1 


Nous allons établir maintenant que la loi d’une variable conditionnelle- 
ment à une valeur fixée de la somme est une loi hypergéométrique. La loi 
de X, conditionnellement à S —s par exemple, est définie pour 
xe{0,1,...,n:} par: 
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P(X = x)P(S = s|X = x) 


P(X = xlS = = 
(X = xIS = 5) PS =5) 
_ P(X=Xx)PY =5s — x) 
_ P(S=s) 
ni X on —X m S—X 2 —5+x 
re (re 
# Fe) pan 
S 
ni n; 
x S—X 
_ n + 
S 
Exemple 4.5 


Convolution de lois de Poisson 


Si X et Y sont deux v.a. indépendantes de lois de Poisson respectives 
P(À et P(u), alors Z = X +Y est une va. à valeurs dans N, avec 
pour tout entier k : 


PE=D= PH DPO EDEN PR PTE) 


x+y=k xeN 
k k x k—x 
À UM 

— P(X = PT =Kk— = PRES —H 

2 El # E A ep 

et k! e 4H) 
__ À° k—x = À k 

EE Lx À eu 


On retrouve bien comme résultat : X + Y-=P(X + u). 


ouple de v.a. continues 


oi du couple 


Si X et Y sont deux v.a. réelles continues, la loi de probabilité du couple (X,Y) 
est déterminée par sa fonction de répartition F, définie sur R? par : 


F(x,y) = P(X <x,Y < y) 


La valeur F(x,y) représente la probabilité de la zone hachurée indiquée 
dans la figure 4.2. 
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M(xy) 


D 
X 


KE 
77 


Figure 4.2 


L'application F est croissante au sens large par rapport à chacune des deux 
variables et telle que O0< F(x,y) <1, avec pour valeurs limites 
F(—co,y) = F(x,—oo) =0 pour tout x réel et pour tout y réel, et 
F(+00,+00) = 1. 

Si F est deux fois dérivable par rapport aux deux variables, alors la loi de 
(X,Y) est dite absolument continue, de densité f définie par : 


d2F(x,y) 


f(x, y) = 3x0 


La fonction de répartition se calcule alors par intégration : 


F(x,y) = 1 le f(u,v)dudv 


Exemple 4.6 
La loi de (X,Y) est définie par la densité : 


_ Je” si O<x<7y 
FRE Ê sinon 


Les valeurs de la fr. F vont être déterminées selon la zone d’apparte- 
nance du point (Xo,Yo), en intégrant la densité f sur l'intersection du 
domaine où elle est non nulle avec la partie du plan à gauche et au-des- 
sous du point (voir figure 4.3). On obtient de façon évidente : 


F(Xo,Yo) = 0 si x <0O ou yo <0 
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y 
Y=X 
Yo 
0] xx] Ml x x 


Figure 4.3 


Si maintenant le point (xo,Yo) est dans la zone où la densité f est stric- 
tement positive, soit O < Xo < Yo : 


x0 fo X=x0  PY=O 
CE Î Î Foods 1) Î Has 
—o J x=0 y=x 


X0 X0 
= | [—e dx = | CE) a Er | 
0 € 


) 
=1—-e "0 — xje 0 


Enfin, si 0 < yo < X1, on peut voir sur la figure 4.3 que : 


F(x,Yo) = F(Yo, Yo) = 1 — e7°0 — ype 0 
En résumé : 


0 six <Oouy<0 
F(x,y)={1-e"-xe" si0<x< y 
1—-e—-ye si0<7y<x 


Comme dans cet exemple, la densité se présente souvent sous la forme sui- 
vante : 
_J.. si,» eD 
ren = | 0 si (x,y) # D 


c’est-à-dire que la densité est non nulle seulement à l’intérieur d’un certain 
domaine D. L'expression de la f.r. du couple (X,Y) se détermine alors en dépla- 
çant le point M(x,y) du bas à gauche vers le haut à droite, conformément à la 
figure 4.4 ci-après. 
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Figure 4.4 


Lorsque l’on quitte le domaine sur l’horizontale de M (même ordonnée) ou 
sur la verticale de M (même abscisse), la valeur de F en ces points extérieurs à 
D est la même qu’au point d’intersection de l’horizontale ou de la verticale avec 
la frontière de D. 


ois marginales 


Les fonctions de répartition marginales de X et Y sont définies à partir de la fr. 
du couple par : 


Fx(x) = P(X < x) = F(x,+00) 
FrO@) = PY < y) = F(+00,y) 
c’est-à-dire en faisant tendre y, respectivement x, vers plus l'infini. Dans le cas 


d’une loi absolument continue, les densités marginales sont alors obtenues par 
dérivation de ces fr. marginales. 


Cependant, si la loi du couple est définie par sa densité, les densités margi- 
nales sont obtenues plutôt par intégration : 


6e 11 Fee 


OO 


Fe Î D. 


Exemple 4.7 
Si nous reprenons la loi de l’exemple 4.6 précédent, en faisant tendre y 
vers plus l'infini dans l'expression de F, on obtient : 

Fyx(x) = F(x,+00) =1—-e”* pour x >0 
et par dérivation : fx(x) = e* 
ou y(1). 


pour x > 0, densité de la loi exponentielle 
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Cette densité peut également être obtenue par intégration de la densité du 
couple, pour x > 0 : 


+00 +00 
fx) = Î fG,y)dy = Î éa= Er = 
La f.r. de Y s'obtient à partir de F en faisant tendre x vers plus l'infini : 


Fr) = F(+o,y)=1-e7—ye” pour y >0 


d’où par dérivation, pour y > 0 : fy(y) = ye”” qui est la densité de la 
loi y (2). 
Ou par intégration de f, pour y > 0 : 


+00 y 
foÿ= 'l fade 1 ex = ye” 
—00 0 


ois conditionnelles 


Si l’une des deux variables X ou Y a une valeur fixée, on peut définir la loi 
conditionnelle de l’autre variable. Pour des lois absolument continues, les lois 
conditionnelles sont définies par les densités conditionnelles : 


f@X,7) 
x Y — — 
LE 
1G:Y) 
Y X — = 
fo x) PASS 


à condition bien sûr que f;(y) > 0 et fx(x) > O. 


Exemple 4.8 
Si nous reprenons la loi précédente, nous obtenons pour 0 < x < y : 
e ? 1 
fQY = 7y)=—=- 
Ye y 


donc la loi conditionnelle L(X\Y = y) est la loi uniforme sur [0, y], pour 
y > 0 fixé. De même, pour y > x > 0 : 


= 
€ = 
—x 


frOIX = x) = 


€ 


qui est la loi exponentielle sur [x,+oo[, pour x > 0 fixé. 
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L'indépendance des va. X et Y se définit alors par : 
f@;y)= fx@)fr0) VxeR,VyeR 


On a bien entendu dans ce cas : 


fxQÙY =7y)= fxQ) ef frOIX=x)= fr0) VreR,VyeR 


oments associés à un couple 


Si h : R? — R est une application continue, l’espérance de A(X,Y) se calcule 
pour une loi de densité f par l’intégrale : 


ETACX,Y)1 = | Î GDS NdrdY 


Dans le cas particulier où A(X,Y) = [X — E(X)I[Y — E(Y)], ceci définit 
la covariance : 


Cov(X,Y) = E{[X — E(X)IY — E(Ÿ)]} = E(XY) — E(X)E(Ÿ) 


Dans le cas particulier où les v.a. X et Y sont indépendantes : 
EG = ff avftnaxds 
R2 


= Î Cas l yfrO)dy = ECX)E(Y) 
R R 
et par conséquent : 
Cov(X,Y) =0 


Il faut faire attention à la réciproque, généralement fausse, c’est-à-dire que si 
deux v.a. ont une covariance nulle elles ne sont pas forcément indépendantes, sauf 
dans le cas particulier où (X,Y) est un couple normal (cf. Propriété $ IV., B.). 


Exemple 4.9 
Soit X une va. de loi N(0,1) et définissons Y = X?. On a : 
Cov(X,Y) = E(XY) — E(X)E(Y) = E(X*) = 0 


car tous les moments d'ordre impair sont nuls ; donc les v.a. X et X? ont 
une covariance nulle alors qu’elles sont dépendantes (mais non linéaire- 
ment) puisque la seconde est fonction de la première. 


On peut définir également le coefficient de corrélation linéaire par : 
Cov(X,}) 


p = Corr(X,Y) — 560) 


ayant posé V(X) = o?(X) et V(Y) = o?(Y). 
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Nous allons établir que ce coefficient est compris entre —1 et +1, en raison 
de l'inégalité de Schwarz : 


lE(XY)I < Y E(X7)V E(#?) 


que l’on obtient en considérant le polynôme en À, toujours positif : 
E(X — 17} = }2E(Y?) — 21E(XY) + E(X?) > 0 


ce qui implique E?(XY) — E(X?)E(Y?) < 0, soit en appliquant cette inégalité 
aux variables centrées : 


|Cov(X,Y)| < o(X)o(Y) 


et par conséquent |p| < 1. Le cas |[p| = 1 correspond à l’existence d’une rela- 
tion affine entre les deux variables : 


lbl=l1— 34 ER*,ER:Y =aX+b 
Cette relation affine, quand elle existe, s’écrit d’ailleurs précisément : 


Cov(X.Y 
Ÿ = E(Ÿ)- . x = E(X)] 


égression 


Les densités conditionnelles permettent de calculer les moments conditionnels, 
comme par exemple les espérances ; on peut définir notamment la fonction : 


xk E(YIX = x) 
qui s’appelle fonction de régression (non linéaire), son graphe étant la courbe de 
régression de Y en X. 


Pour une loi absolument continue, on obtient : 


+00 


= LP TE) 
ROUX = dy = | y ES 


E(YIX = x) = Î 


—00 


Exemple 4.10 


En reprenant toujours la même loi des exemples précédents, on obtient ici : 


+00 +00 
E(YIX = x) = ‘ ye" dy = | yd(—e”?) 


+00 
=x+e | edy=x+1 
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Notons que E(Y]|X) est une v.a., comme fonction de la v.a. X, et que ses réa- 
lisations sont les valeurs E(Y|X = x) pour tout événement élémentaire « tel 
que X (©) = x. On peut donc calculer l’espérance mathématique de cette v.a. : 


+00 


+00 +00 
ELE(YIX)] = Î E(FIX = x) fxGdx = Î Î FES diaS 


—00 


2 il "| Fr Î fO)dy = EX) 


OO 


Ainsi, en prenant l’espérance de E(Y]|X) par rapport à la loi de X on retrou- 
ve E(Y). 


Exemple 4.11 


Dans l'exemple précédent on a obtenu la va. E(YIX)=X +1 et 
ETE(Y]|X)] = E(X) + 1 =2 qui est bien l'espérance de Y qui suit une 
loi y (2). 


On peut également calculer la variance conditionnelle : 


V(YIX = x) = E{[Y — E(YIX = x)l|X = x} 
= E(Y?|X = x) — E(Y|X = x) 


De même V(Y|X) est une v.a., étant fonction de X, dont on peut calculer 
l’espérance. On démontre que la variance de Y se décompose à partir des deux 
premiers moments conditionnels de la façon suivante : 


V(Y) = E[V(YIX)] + VIE(FIX)] 


oi d'une somme 


La loi de la v.a. Z = X + Y se détermine par sa fr G, définie par : 
G(z) = P(Z <z) = P(X +Y <2) 


qui ne peut se calculer que si l’on connaît la loi du couple (X,Y). 


Dans le cas particulier où ce couple admet une densité f, on obtient : 


G@ = h | fon 
D 


où le domaine d’intégration est D = {(x,y)/x + y < 7}. On effectue le chan- 
gement de variable suivant : 


X = X X=X 
S=x+y Y=S—X 
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Le jacobien de cette transformation est : 


D(x,y) -| 1 0 


= = | 
D(x,s)  |-1 | 


d’où l'intégrale : 


+00 Z=X +00 Z 
c@= | ax | füsdy = | ax | fG,s — x)ds 


qui peut s’écrire sous la forme : 
G@= [| etds 


ce qui permet de mettre en évidence la densité de Z, soit : 


+00 
g(s) = k f(x,s — x)dx 


Dans le cas particulier où X et Y sont indépendantes, la loi de Z=X +Y 
se détermine à partir des densités marginales f; et fr : 


CCE Î Î ET = 1 ee 


O0 


où la densité g de Z est définie par : 


Lo L be Î GENS 


et g s’appelle alors le produit de convolution de f}; et fr. 


Exemple 4.12 

Soit X et Y deux v.a. indépendantes et de même loi de Laplace, ou double 
1 

exponentielle, de densité ne On a vu que la densité du couple 


(X,Z = X +Y) était fx(x) f,(z — x) et la densité marginale de Z s’ob- 
tient donc par intégration : 


+ ] 


+00 1 
8(z) = Î xx) fr (z — x)dx = Î D 


—00 


L il e lg x + + ee“ blax 
LE 4 Je 
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Pour pouvoir retirer la valeur absolue, il faut connaître le signe sur l’in- 
tervalle d'intégration et pour cela distinguer deux cas : 


— siz <0: 


S 0 +00 
Ag(z) = Î et dx + e°dx + Î dx 
_00 k à 


1 
= ÉLE Ts ze’ el Se Lt 
1 1 
= a — ze + = (1 — z)e’ 


u z +00 
4g(z) = Î e* “dx DE Î e “dx + Î eZ dx 
00 0 . 


1 1 
SEE ze tel ee 


1 1 
= 5e + ze + 2 = (1+z7)e* 
La densité de Z = X + Y pouvant s’écrire dans tous les cas : 


1 
8@=24d+ IzDe 


ecteur aléatoire 


Nous allons étendre maintenant les notions précédentes au cas d’un vecteur 
aléatoire ayant n composantes, avec n > 2. Un vecteur aléatoire X de R” est 
une application de 2 dans R” qui s’écrit sous la forme d’un vecteur colonne : 


Xi 
Xx=| : 
X, 


dont toutes les composantes X;,1 < i <n, sont des v.a., c’est-à-dire des appli- 
cations de (2 dans R. On définit alors l’espérance de ce vecteur aléatoire comme 
le vecteur dont les n composantes sont les espérances des v.a. réelles compo- 
santes de ce vecteur et on conserve la même notation qu’en unidimensionnel : 


E(Xi) 
E(X) = 
E(X;) 
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Dans le cas d’un couple aléatoire, nous avions introduit la covariance comme 
moment centré d’ordre deux ; s’agissant ici d’un vecteur à n composantes aléa- 
toires, il faut considérer toutes les associations deux à deux de ses composantes. 
La généralisation de la variance définie en unidimensionnel, indicateur numé- 
rique de dispersion autour du centre, sera ici une matrice, notée encore V(X), 
et qui contiendra toutes les variances des composantes de X, ainsi que les cova- 
riances de tous les couples associant deux composantes. Cette matrice est aussi 
un indicateur de dispersion autour du centre E(X) qui renseigne sur la forme de 
l’ellipsoïde d'inertie ; c’est une matrice carrée symétrique d’ordre n, appelée 
matrice de variances-covariances, et définie par : 


V(X) = E{IX — E(X)'TX — E(X)]} 


c’est-à-dire comme l’espérance d’une matrice M dont les éléments sont des v.a. 
Mi; et qui est définie comme la matrice d’éléments E(M,;;). L'élément ligne à, 
colonne j, de cette matrice, 1 < i,j < n, est d’ailleurs : 


Vij — E{[X; — E(XH)IIX, E(X;)1 Æ Cov(X;,X,;) 


et par conséquent on trouve les variances sur la diagonale principale de cette 
matrice : 
vi = E{[X; — E(X;)F} = V(X;) 


Comme propriétés de ces deux moments généralisés, nous allons examiner 
les effets d’un changement d’échelles, traduit par une application linéaire de R’ 
dans R”' de représentation matricielle À de format (m,n), puis d’un changement 
d’origine, traduit par une translation de vecteur b de R”'. Le vecteur X devient 
après cette transformation affine le vecteur Y = AX + b. L'opérateur espérance 
mathématique est toujours linéaire en multidimensionnel et le vecteur espéran- 
ce va donc subir la même transformation : 


E(Y) = E(AX + b) = AE(X) +b 


alors que la matrice de variances-covariances n’est pas modifiée par le change- 
ment d’origine, étant un moment centré : 


V(Y) = V(AX +b) = V(AX) = AV(X)'A 
En effet : 
Y —E(Y) = AX +b—T[AE(X) + b] = A[X — E(X)] 
et par conséquent : 
[Y — E()'TY — E(Y)1 = AIX — E(X)I'IX — E(X)]'A 


On peut opérer une transformation particulière permettant d’obtenir le vec- 
teur Y centré et réduit. La matrice Z = V(X) étant définie-positive admet une 
inverse Z ! définie-positive et il existe une matrice symétrique S telle que 
$? = Z°!, qui sera notée $ — Z°7//?, On effectue alors la transformation : 


Y=> IX -E(X)] 
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où le vecteur Y est centré puisque E(Y) = 0 et réduit, au sens où ses compo- 
santes sont non corrélées et de variance un : 


VŒH)=Z Ex 22 SES) = SS ! = I, 
car ZX = ES? — 7, d'où ES = S7!. 


ois usuelles 


oi multinomiale 


Il s’agit en quelque sorte d’une loi binômiale multidimensionnelle où on ne 
s'intéresse pas seulement à la réalisation d’un événement particulier À, mais à 
celle de k événements distincts A,,...,A, de probabilités respectives p:,...,p4 
au cours de n épreuves successives indépendantes. On a bien entendu p; > 0 


pour 1<j<ket Y, P; = 1. On associe alors à cette expérience aléatoire le 
j=1 
vecteur N à valeurs dans {0,1,...,n}* dont les composantes N;,1<j<k, 
représentent le nombre d’événements À; réalisés. Le vecteur aléatoire N suit une 
loi multinomiale de paramètres n,p1,...,p4, notée M(n; p1,...,p.) et définie 
par : 
n! ñ 3 
P(N =n,...,N;=nx) = Poe AM De 
ni:...nhg: 

où (n1,...,nx) € {0,1,...,n}". Il est important de noter que les va. compo- 
santes de N ne sont pas indépendantes puisque : 


k k 
) N; = ) n;=n 
j=l = 


Le coefficient qui figure devant p'!... p;*, qui représente la probabilité d’un 
événement élémentaire réalisant l’événement (N, = n;,...,N; = n;), est le 
nombre de partitions de n objets en k classes d’effectifs donnés n;, avec 
nm +...+n, = 1, ou le nombre de suites ordonnées de n objets comportant n; 
objets identiques, 1 < i < k, choisis dans & classes distinctes (cf. Compléments 
$ C. chap. 1). 


Si on pose ‘p = (p1,...,p4), on peut écrire N ++ Mn; p) et ce vecteur 
aléatoire admet comme espérance : 


E(N:) Pi 
E(N) = : =n| : | =np 
E(N) Pr 
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En effet, toutes les lois marginales vont être des lois binômiales puisque les 
v.a. N; représentent le nombre de réalisations de l’événement À; au cours de n 
épreuves indépendantes : N; -> B(n,p;) avec p; = P(A;), donc E(N,;) = np; 
et VON;) = np;(1 — p;). 


Pour calculer les covariances : 
Cov(N;,N,;) — E(N;N;) = E(N;)E(N;) 


qui ne sont pas nulles puisque les composantes de N sont liées par une relation, 
nous avons besoin de la loi du couple (WN;,N;) qui est une loi 
Mn; pi,p;,1 — pi — p;) ou loi trinômiale associée aux trois événements À;,A; 
et À; N À; è 


n! 


P(N; =n;,N,=n;) = pl — p, — p;)" "ii 
( J j) nana n-n) P; ( D Dj) 


avec n; et n; entiers positifs tels que 0 <n; +n; <n. 
Nous pouvons écrire : 
E(N;N,;) = ETN;E(N;IN;)] 


en effet : 


n; 


i n 


E(N;N;) —= DD nn;P(N —= ni, N; —= n;) —= D nE,, P(N: —= ni) 
nj à 


l 


où on a posé : 


P(Ni=n,,N;=n; 
E,, _ Dm, ( n j un) 
7j 


P(N; = ni) 


D _n;P(N,; = njiN; = n;) = E(N;IN; = ni) 
nj 


et n;E,; représente bien une réalisation de la va. N;E(N;IN;). Pour calculer 
cette espérance conditionnelle, nous allons déterminer la loi conditionnelle de 
N;IN; = n; qui est la loi binômiale de paramètres n — n; (on retire les n; réali- 
sations des À,) et de probabilité individuelle de réalisation : 
P(A;N A;) : P(4;) 4) 

P(A;) PCA) lp: 


P(A;lAi) = 


L’espérance de cette loi binômiale est donc : 
Pi 


E(N;IN;) = (n — N:): — hp, 


et ainsi : 


P; 
= 


E(NIN;) = EIN;@n — Nj)] = EU — E(N°)] 


126 e STATISTIQUE ET PROBABILITÉS 


© Dunod. Toute reproduction non autorisée est un délit. 


Par ailleurs : 


EN?) = V(N:) + E°(N;) = npi(l — pi) + n°pf 


june 
l— p: Ép 


E(N:N,;) = np: P;( ) =n(n — 1)pip; 


et enfin : 
Cov(N,,N,;) — np; p;(n —l—n) = —ANPipP; 
La matrice de variances-covariances de N s’écrit donc : 
V(N) = n[p:(6; = Pijlisi,j<k 


où ë; est le symbole de Kronecker qui vaut 1 quand i = j et 0 sinon. 


oi normale vectorielle 


Nous allons définir la loi normale multidimensionnelle à partir de la loi norma- 
le qui a été définie dans R au chapitre 3. 


Définition 


Un vecteur aléatoire X à valeurs dans R” suit une loi normale si toute com- 
binaison linéaire de ses composantes (qui sont des v.a. réelles) suit une loi nor- 
male dans R. Si a est un vecteur de R” qui définit une telle combinaison 
linéaire, ceci s’écrit : 


X= N,&VaeR", 'aX = ÿ ax; ss N, 
=] 


— Remarque 


Pour ne pas introduire de restrictions sur les coefficients de la combinaison 
linéaire, on adoptera comme convention que la loi de Dirac &,, (cf. chap. 3, 
$ I, A) se confond avec la loi normale N(m,0) d’écart type nul. 


Il découle immédiatement de la définition que toutes les composantes d’un 
vecteur normal sont des v.a. réelles normales, puisqu'il suffit de choisir toutes 
les coordonnées de a nulles, sauf a; = 1,1 <i<n et ainsi 'aX = X;, = N.. 
Cependant, 1l faut faire attention que la réciproque de cette propriété est fausse 
en général, c’est-à-dire que si toutes les v.a. X; suivent des lois normales, il n’est 
pas certain que X soit un vecteur normal. C’est pour cela que l’on ne peut pas 
définir un vecteur normal comme ayant des composantes normales, sauf dans un 
cas particulier que nous verrons ultérieurement. 
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Comme dans le cas unidimensionnel, la loi normale en multidimensionnel 
est entièrement déterminée par deux paramètres qui sont ici le vecteur espérance 
4 = E(X) et la matrice variances-covariances Z = V(X), la densité au point 
X = (x1,...,%,) ayant pour expression : 


1 1e > 
GE EH) 


(V2r)"Vdet Z LE 


il s’agit de la généralisation de l’expression de la densité de la loi N,(u,0?) que 
l’on peut écrire sous une forme équivalente, dans le cas où x € R : 


F@) = 


1 
V2r Vo? 


Le terme de l’exponentielle fait intervenir la métrique définie par la matrice 
El: 1x — IE On écrit symboliquement : X -= W,(1, 2). Remarquons que 
cette notation n’est pas homogène avec celle retenue en unidimensionnel, puis- 
qu’en faisant n — 1 le second paramètre est ici la variance alors que figurait 
dans le cas réel l’écart type comme second paramètre. On peut remédier à cet 
inconvénient en distinguant dans le cas réel les notations N(u,o?) et N(u,o). 


1 
exp — = "(x — a)(o?) "(x — u) 


f @) = ; 


Exemple 4.13 


Étudions le cas particulier de la loi normale d’un couple (X,Y) dont la 
densité s'écrit pour |p| < 1 : 


1 1 
= exp x 
27x0%0y4y 1 — p? 20-27) 


Par identification avec l'expression générale de la densité de la loi nor- 
male, nous allons voir comment interpréter les cing paramètres qui appa- 
raissent ici. Tout d'abord on voit que det Z = o?02?(1 — p°). Par ailleurs, 
on remarque aussi que le crochet de l’exponentielle est une forme qua- 
dratique de x — 1x et y — j1y qui peut s’écrire : 


1 
ÿ Lo; (x ux) — 2p0x0y(x — ux)(Y — Uy) + ox(y — uy)] 
OxOy 


Le terme de l’exponentielle peut donc s’écrire : 


1 o —DOxOy \f x — Uix 
= _— = Y 
2derx À Hx af Te, ox Y— Hy 


128 © STATISTIQUE ET PROBABILITÉS 


© Dunod. Toute reproduction non autorisée est un délit. 


On voit bien alors sous cette forme que (X,Y) est un couple de v.a. nor- 
males, d’espérances respectives 1x = E(X) et y = E(Y) et de 
matrices variances-covariances > vérifiant : 


Sie 1 ü} —POxOY 
det Z | —00x07 ok 


2 oÈ POxOy 
POxOy  O? 
ce qui permet d'en déduire que o?=V(X), o?=V(Y) et 


Cov(X,Y) = pozoy donc p = Corr(X,Ÿ). 
Nous allons déterminer maintenant la régression de Y sur X : 


E(YIX = x) =) fr OIX = x)dy 
avec ici : 
FX, y) 1 1 
»OIX = x) = = : 
SR | De ] 
où : 


X—Wx\ , X—Ux  Y—Ur  [Y-Ur\ 
g(x,y) = ä 290 X Î 


x Ox Oy 


2 
(l P(EE) 
Ox 


(== ue) 
=: p 
Oy OX 


Pour calculer l'intégrale, on fait donc le changement de variable : 


_ M 
Pt p ERP ar et dy = oyy1 — p?du. 


Oy Ox 


On obtient alors : 


© = 
E(YIX = x) = [uoy V1 — p? + pe (x — ax) + uyle "du 
X 


1 +00 
NW 27 [. 
© 
=p— (x — Uix) + Ur 
Ox 


la fonction de régression d’une variable d’un couple normal sur l’autre 
est donc une fonction affine, c’est-à-dire que la courbe de régression est 
ici une droite. Dans le cas particulier où les variables sont centrées et 
réduites on obtient la régression linéaire E(Y|X) = pX. 
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+ Cas particulier 


Après la définition de la loi normale vectorielle, nous avions noté que n va. 
réelles normales ne constituaient pas nécessairement les composantes d’un vec- 
teur normal. Cependant, si X,,...,X, sont des v.a. normales indépendantes, de 
lois respectives N(u;,0;),1 <i <n, alors elles constituent les composantes 
d’un vecteur X normal, toute combinaison linéaire de v.a. normales indépen- 
dantes suivant une loi normale. Ses paramètres sont : 


CF 
Hi 0 
E(X) = et V(X) = ê 
Un 0 
Où 
avec pour densité au point x = (x1,...,X,) : 
#0) = [1 — Ze - Lt - ny 
X) — Xi i 
i=1 CN 27 : 26? 


1 1 = ( — Hi ) 
= — exp ) 
(V2x)" IT 0: 2 O; 


Dans le cas particulier de variables centrées et réduites, c’est-à-dire pour 
di =0 et 6 —=1,1 <i<n, on obtient la loi normale standard vectorielle, 
X = N,(0,1,), de densité : 


f(x) ) ; : "I I? 
X) = ———Û@Xp — — X, = =——€Xp — —||X 
(V27T)" à 24 (27)? k 2 


la norme étant ici la norme euclidienne classique. 


Propriété 


Si X; et X; sont les composantes d’un vecteur normal, elles sont indépen- 
dantes si et seulement si leur covariance est nulle : Cov(X;,X;) = 0. 


Nous avons ici un cas particulier où la covariance nulle implique l’indépen- 
dance. Il faut cependant bien faire attention à l’énoncé de cette propriété, car si 
X; et X; sont deux variables normales dont la covariance est nulle, cela n’im- 
plique pas forcément qu’elles soient indépendantes. Pour s’en convaincre exa- 
minons l’exemple suivant. 


Exemple 4.14 
Soit X de loi N(0,1) ete de loi définie par P(e = 1) = P(e = —-1) 


1 

2 
deux v.a. indépendantes à partir desquelles on définit la v.a. Y = eX. La 
loi de probabilité de cette nouvelle variable est définie par : 
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P(Y < y) = P(EX < y) 
= P{(EX < y)N(e = 1)}+ P{(EX < y)N(E = —1)} 


1 1 
Se 


1 
= 5120) +1 P(—y)] = (y) 


où ® est la f.r. de la loi N(0,1) qui est donc la loi suivie par Y. Par 
ailleurs : 


Cov(X,Y) = E(XY) — E(X)E(Y) = E(eX?) = E(e)E(X?) =0 


Si on en concluait que X et Y étaient deux variables indépendantes, la 
va. X + Y suivrait alors une loi N(0,V2). Or : 


P(X+Y = 0) = P{(e + 1)X = 0} = P(e = —1) : 


ce qui est incompatible avec le fait que la loi de X + Y soit continue. On 
a donc établi que X et Y sont deux variables normales de covariance 
nulle et cependant dépendantes. 


+ Transformation affine d’un vecteur normal 


Soit X un vecteur de loi W,(4,2) et de composantes X;,1 < i < n. Nous allons 
effectuer une transformation affine à partir d’une matrice À de format (m,n), 
traduction matricielle d’une application linéaire de R”" dans R””', et d’un vecteur 
de translation b de R" : Y = AX + b. Nous allons établir tout d’abord que le 
vecteur Ÿ est aussi normal. En effet, si a est un vecteur quelconque de R’”", la 
combinaison linéaire : 


laY = ('aA)X + 'ab= Ÿ aX;+BN 


i=1 


ayant posé ‘a = ‘aA, vecteur de composantes &;,1 <i <n,et 8 = ‘ab eR. 
En effet, par définition de la loi normale vectorielle, la combinaison linéaire 
‘aX est une v.a. réelle normale et donc aussi ‘a X + B. Aïnsi, toute combi- 
naison linéaire des composantes de Y suit une loi normale, ce qui signifie par 
définition que Y est un vecteur normal de R”"'. D’après les propriétés des opé- 
rateurs espérance et variance vues au II, ses moments sont E(Y) — 
AE(X) +b = Au +b=u'et V(Y) = AY 'A = Y,et ainsi Y = NW,(u',Z). 


Dans le cas particulier d’une transformation linéaire, c’est-à-dire avec b = 0, 
et pour un vecteur X de loi normale standard, X -= W,(0,1,), alors : 


Y = AX = N,(0,A A). 
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- Loi du khi-deux 


Soit un vecteur X de loi normale standard W/,(0,1,) et A une matrice symétrique 
d'ordre n. On établit le résultat suivant : 


'XAX = es & À est une matrice idempotente de rang p. 


Rappelons que À est idempotente si A? = À et que dans ce cas 
rang À = ftraceÀ. 


Si À et B sont deux matrices symétriques et idempotentes, on a également 
le résultat suivant : 


‘XAX et ‘XBX sont des v.a. indépendantes & AB = 0. 


À retenir 


Deux v.a. sont indépendantes si la loi du couple s’obtient comme pro- 
duit des lois marginales : produit des probabilités des points dans le cas dis- 
cret et produit des densités dans le cas continu. 


La covariance est une mesure de la dépendance linéaire entre deux v.a. 
Deux v.a. indépendantes ont une covariance nulle. La réciproque est fausse 
en général. Cependant, si deux v.a. sont des composantes d’un vecteur nor- 
mal et que leur covariance est nulle, alors elles sont indépendantes. 


La fonction de régression d’une variable Y sur une variable X associe à 
tout réel x l’espérance (moyenne) de Y lorsque la valeur de X est fixée, 
égale à x. 

Un vecteur aléatoire admet comme composantes des variables aléatoires 
réelles. On lui associe comme moments son espérance, caractéristique de 
valeur centrale, vecteur dont les composantes sont les espérances des v.a. 
composantes, et sa matrice de variances-covariances, caractéristique de dis- 
persion dans l’espace, qui rassemble les variances des composantes sur la 
diagonale principale et les covariances des composantes associées deux à 
deux pour les autres éléments. 


Par une transformation affine (changement d’échelles et d’origine), les 
moments deviennent : 


E(AX +b) = AE(X)+b 
V(AX + b) AV(X)'A 


pour toute matrice À de format (m,n) et tout vecteur b de R”. 
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Compléments 


pplication mesurable 


Les notions vues dans le chapitre 2 se généralisent en multidimensionnel, où IR” est 


muni de sa tribu borélienne B, engendrée par les ouverts ou les pavés de la forme 
n 


El — 00,x;[ . Un vecteur aléatoire X est alors défini comme une application mesurable 
i=1 

de (@,.4) dans (R",B). La loi de X admettra une densité si elle est absolument conti- 
nue par rapport à la mesure de Lebesgue À de R”, définie à partir de : 


AT [le.bD = T [@: — a). 
i=1 i=1 


hangement de variable 


Soit g : R' — R” une application bijective de X (2), ouvert de R”, dans un ouvert de 
R'", admettant des dérivées partielles continues ainsi que son inverse g—!. Si Xest un 
vecteur aléatoire de R'" de densité f, alors Ÿ = g(X) est un vecteur aléatoire de R" de 
densité h définie par : 


D(x) 
hO) = [87 | 
D() 
D(x) PT —. | 
où DO) représente le jacobien de la transformation inverse, c’est-à-dire le déterminant 
52 


des dérivées partielles des anciennes variables exprimées en fonction des nouvelles sous 
la forme x; = g; L(y),1 <i<n, donc ayant comme élément ligne À, colonne j, 
1<j<n: 


1 
08; (y) 
07; 
Si on retient comme application la convolution, pour obtenir la loi de la somme de n 
va. indépendantes X,,...,X, on fait le changement X1 = X1,...,X 1 = X,_1, 
Y=X;+...+X,. Les anciennes coordonnées s’écrivent sous la forme 
X1 = X1,... Xp 1 = Xp Xn = Ÿ — X] — ... — X,_1 d’où un jacobien égal à un et une 


densité de Ÿ qui se détermine par : 


h(y) = | FX1,...,Xn-1,Y — Xi — ... — Xn-1)dx1 ... dxn-i 
R'- 
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Dans le cas d’un couple aléatoire (X,Y) transformé par l’application g en couple 
(U,V) on détermine les anciennes coordonnées en fonction des nouvelles sous la forme 
x = x(u,v) et y = y(u,v) et l’élément différentiel f(x,y)dxdy est transformé en 


D(,y) 


“i 
flg Go 


Idudv où : 


Ax(u,v)  Ox(u,v) 


D(x,y) _ ou ôv 
D(u,v) dy(u,v)  dy(u,v) 
du av 
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ercices 


Enoncés 


Exercice n°1 


Soit (X,Ÿ) un couple de v.a. discrètes dont la loi de probabilité est donnée par le tableau 
ci-après : 


. y 1 2 3 4 
ñ 0,08 0,04 0,16 0,12 
2 0,04 0,02 0,08 0,06 
3 0,08 0,04 0,16 0,12 


1) Déterminer les lois marginales de X et Y et préciser si ces v.a. sont indépendantes. 
2) Calculer Cov(X,Y). 
3) Déterminer la loi du couple (min{X,Y},max{X,}}). 


Exercice n°2 


Une urne contient une boule numérotée 1, deux boules numérotées 2 et trois numérotées 
3. On effectue deux tirages successifs sans remise dans cette urne. Soit X et Y les va. 
qui représentent respectivement les chiffres obtenus au premier et au second tirage. 
Déterminer la loi de probabilité de S = X + Y puis calculer E(S) et V(S). 


Exercice n°3 


Soit (X,Ÿ) un couple de v.a. discrètes dont la loi de probabilité est donnée par le tableau 
ci-après : 


ÿ X 0 1 : 
1 1/12 0 1/12 
2 2/12 1/12 1/12 
3 3/12 2/12 1/12 


1) Déterminer les lois marginales de X et Y et préciser si ces v.a. sont indépendantes. 
2) Calculer Cov(X,Y). 


3) En déduire la loi de probabilité de la variable aléatoire E(Y|X). Calculer E[E(Y]|X)] ; 
le résultat était-il prévisible ? 
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Exercice n°4 


Soit (X,Ÿ) un couple de v.a. discrètes dont la loi de probabilité est donnée par le tableau 


ci-après : 
. Y 1 2 3 4 
1 0 0 0 0,3 
2 0,2 0 0 (0) 
3 0 0,1 
4 0,3 0,1 0 0 


Déterminer les lois conditionnelles de X sachant que Ÿ = 1 puis de Ÿ sachant que 
X € {3,4}. 


Exercice n°5 


Soit X et Ÿ deux v. a. de loi normale centrée et réduite et de coefficient de corrélation 
0 


1 
linéaire o = sin 0. On montre que P(X > 0,Y > 0) — 4 + nn P- 
JT 


1) Déterminer la loi de probabilité des v. a. —X et —Y et en déduire la valeur de 
P(X <0,Y <0). 


2) Soit X, et X) deux v. a. qui ont la même loi que X et },, Ÿ, deux v. a. qui ont la même 
loi que Y, les couples (X:,Y1) et (X2,}2) étant indépendants. Déterminer les lois de pro- 
babilité des v. a. U = X;, — X;, et V — Y, — Y;. Calculer le coefficient de corrélation 
linéaire de U et V et en déduire P(U > 0,V > O0). 


3) On définit les va. W=1sU >0,W—=-1s U <0, Z=1siV -0etZ = —-1 
si V < 0. Calculer E(WZ). 


Exercice n°6 


Soit X et Ÿ deux v.a. indépendantes de lois de Poisson de paramètres respectifs À et 1. 
Déterminer la loi conditionnelle de X lorsque la somme S = X + Y a une valeur fixée 
S = $.En déduire l’expression de la fonction de régression de X sur S puis la valeur de 
ETE(X]S)]. 


Exercice n°7 


Un couple (X,Y) de variables aléatoires réelles admet pour densité 
FX, y) = exp(y — x) pour 0 < y < 1 et y < x, avec f(x, y) = 0 sinon. 


Déterminer les densités marginales de X et Y. Les variables aléatoires X et YŸ sont-elles 
indépendantes ? 


Exercice n°8 


Paul et Virginie se fixent un rendez-vous entre 11h et midi, sans autre précision. Comme 
ils sont impatients tous les deux, celui qui est arrivé part au bout d'un quart d'heure si 
l'autre n'arrive pas pendant ce laps de temps. Calculer la probabilité p qu'ils se rencon- 
trent effectivement à ce rendez-vous. On formalisera le problème en considérant que l'ar- 
rivée de chacun se produit au hasard pendant l'heure fixée du rendez-vous. 
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Exercice n°9 
Soit (X,Y) un couple de v.a. dont la loi est déterminée par la densité : 
__ Jxy/2 s0<x<2e&0<7y<x 
FUN = 0 sinon 
1) Déterminer la fonction de répartition F de ce couple. 
2) Déterminer les lois marginales de X et Y. Ces variables sont-elles indépendantes ? 


3) Déterminer la loi conditionnelle de Y sachant que X = x. 


Exercice n°10 


Soit (X,Ÿ) un couple de v.a. de densité : 


k 
— Ss0<x<y<Il 

fGN= {VS 

0 sinon 
1) Déterminer la valeur de la constante k puis la fonction de répartition F de ce couple. 
2) Déterminer les lois marginales de X et Y. Ces variables sont-elles indépendantes ? 
3) Déterminer les lois conditionnelles de X|Y = y et de Y|X = x. En déduire 
l’expression de la fonction de régression x > E(Y|X = x) puis calculer E[E(Y|X)]. 
Exercice n°11 
Soit X et Ÿ deux v.a. indépendantes et de même loi uniforme sur | — 1,1[. Déterminer 
la loi de probabilité de la v.a. Z = Y — X. 
Exercice n°12 
Soit (X,Ÿ) un couple de v.a. de densité : 


f (y) = (A +a)x? +2(1+ 24) xy + (1 + 4a) y°] 


1 1 [ 
ra ? 2 
avec a > 0. 


1) Déterminer les lois marginales de X et Y. Ces variables sont-elles indépendantes ? 


1 
2) Déterminer la loi de la va. Z = —(X +Y}. 
a 


Exercice n°13 

Si X est un vecteur de loi W, (1,2), montrer que la v.a. réelle ‘(X — u)Z7!(X — y) 
suit une loi du khi-deux à n degrés de liberté. 

Exercice n°14 


Soit X,,X) et X;3 trois v.a. indépendantes de même loi V(0,1). Déterminer la loi de 
probabilité des v.a. suivantes : 


1 X1+X2) Xi+X 
U= A X, y =! FE. 29) _ a 


Er, NW ET 
SD (X1 — X2)? VIFS CT 


1 
Y = sx L2X? + 5X5 + 4X1X2 — 2X1X3 + 4X2X3) 


Z=XI+X+XS-Y 


et montrer que Ÿ et Z sont indépendantes. 
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orrigés 


Exercice n°1 


1) Les lois marginales s’obtiennent par sommation de lignes et de colonnes et figurent 


dans le tableau ci-après : 


Y 
x 1 2 3 4 
1 0,08 0,04 0,16 0,12 0,4 
2 0,04 0,02 0,08 0,06 0,2 
3 0,08 0,04 0,16 0,12 0,4 
0,2 0,1 0,4 0,3 1 


On constate que toutes les probabilités des couples (x,y) s’obtiennent en faisant le pro- 
duit des probabilités marginales, donc X et Ÿ sont indépendantes. 


2) On déduit de la question précédente que Cov(X,Y) = 0. 


3) La loi du couple (min{X,Y},max{X,Y}) est donnée dans le tableau ci-après : 


int pr TT) 3 4 
1 0,08 0,08 0,24 0,12 
2 0,02 0,12 0,06 
3 0,16 0,12 


Donnons un exemple de la façon dont ce tableau a été constitué : 


P(min{X,Y} = 2,max{X,Y} = 3) = P(X = 2,Y = 3) + P(X =3,Y —2) 


= 0,08 + 0,04 = 0,12 


Exercice n°2 


On détermine d’abord la loi du couple (X,Y) donnée dans le tableau ci-après : 


L X 1 2 3 
I 0 1/15 | 1/10 
2 2/30 | 1/15 | 1/5 
3 3/30 | 3/15 | 1/5 
On en déduit la loi de S : 
rs 4 5 6 
Î2/15 4/15 25 1/5 


On obtient E(S) = 14/3 et V(S) = 8/9. 
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Exercice n°3 


1) Les lois marginales s’obtiennent par addition des lignes et des colonnes et figurent 
dans le tableau ci-après : 


X 
yY 0 1 2 
1 1/12 0 1/12 1/6 
2 2/12 1/12 1/12 1/3 
3 3/12 2/12 1/12 1/2 
1/2 1/4 1/4 1 


On voit par exemple que P(X =1,Y =1)=0Z P(X = 1)P(Y = 1) = 1/24 
donc les v.a. X et Ÿ ne sont pas indépendantes. 


2) On calcule à partir du tableau E(X ) = + —_ E (Y) = + + — puis 
E(XY) nn (@ 6+2+4+6) — On en déduit Cou(X,Y) = = 


ce qui confirme que les variables ne peuvent pas être indépendantes. 


3) Il faut au préalable déterminer les lois conditionnelles de Ÿ qui sont données dans le 
tableau ci-après : 


Y 1 2) 3 

X=0 1/6 1/3 1/2 
Y=1 0 1/3 2/3 
X—2 1/3 1/3 1/3 


On calcule alors à partir du tableau précédent : 
7 8 
E(Y|X = 0) = 3 E(YIX = 1) = 3 E(YIX =2) =2 


On en déduit la loi : 


E(Y|X) | D 7/3 8/3 
|14 12 14 
puis la valeur : 
ELE(YIX)1 = 2 + 7 =: 
74 6 3 3 


On retrouve bien la valeur de E(Y). 


Exercice n°4 


Comme P(Y = 1) = 0,5 la loi de X|Y = 1 s’obtient en multipliant la première colon- 
ne par deux et est donnée par le tableau ci-après : 
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XF =1 1 2 3 4 


0 0,4 0 0,6 


On a P(X € {3,4}) = 0,5 ; on additionne les deux dernières lignes et ensuite on multi- 
plie aussi par deux pour obtenir la loi de Y|X € {3,4}, donnée dans le tableau ci-dessous : 


YIX e {3,4} 1 2 3 4 


Exercice n°5 


1) On a: 
P(-X <x)= PIX > —-x) = 1 — P(—-x) = D(x) — P(X < x) 


donc —X et —Ÿ suivent aussi des lois normales centrées et réduites. On en déduit : 
P(X <0,Y <0)= P(-X >0,-Y -0)=p 
2) Toute combinaison linéaire de v. a. normales indépendantes suit une loi normale, donc 
U et V suivent des lois normales centrées et de variance 2. On calcule : 
Cov(U,V) = E(UV) = E(X1Y1) — E(X1Y2) — E(X2Y1) + E(X2h2) = 20 
On en déduit corr(U,V) = p puis : 


PU>OV-O=P( T0 >0) = p. 
3) On calcule : 
E(WZ)= P(WZ =1)-P(WZ=-1)=2P(WZ =1)-1. 
Ensuite : 
P(WZ=1)=P(W=Z=1)+P(W=Z=-1) = P(U >0,V > 0) 
+ P(U <0,V <0) =2p 


Ainsi : 20 
E(WZ) =4p —1 = — 
TT 


Exercice n°6 


Nous savons que S suit une loi de Poisson de paramètre À + 4 et par conséquent, 
pour0O<x<s: 
P(X = x,S —5s) _ P(X= x)P(S = s|X = x) 


FÉES eg = P(S=5) 
: P(X = x)P(Y = s — x) : s! AU 7 
P(S=5) To Lu 


OGC) 


ce qui montre que la loi de X|S = s est une loi binômiale de paramètres s et 
donc d’espérance : H 


E(XIS=s)=s 


À 


1+u 
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Ainsi, E(XIS) = S et E[E(X|S)] = ES == E(X). 


A+ 


Exercice n°7 


Les densités marginales s’obtiennent par intégration de la densité du couple : 


fx (x) | e"“dy=1-e"s0<x<l 
0 


1 
fx (x) = e*dy=(e-1)e “sil <x 
0 
avec fx (x) = 0 six <0; 
+00 
QUE #o= | e ‘dx =1si0<y<l 
; 


la densité étant nulle en dehors de cet intervalle. 


Les variables aléatoires X et Ÿ sont dépendantes car f (x,y) Æ fx(x) fr(y) 


Exercice n°8 


On note X et Y les v.a. qui représentent les dates d'arrivée de Paul et Virginie à leur ren- 
dez-vous, en prenant 11h comme origine et l'heure comme unité de temps. Leur arrivée 
au hasard se traduit par l'hypothèse que ces deux v.a. suivent une loi uniforme sur [0,1] 
et sont indépendantes. Leur rencontre correspond alors à l'événement | X — Y| < ï et la 
probabilité p s'obtient par l'intégrale suivante : 


1 
p=Plx Y| < = f faxa) 
4 D 


où le domaine d'intégration est D — {Gx,y) /O<£<x<1,0<7y<1,{x — y| < 1} 3 


Compte tenu de la forme de ce domaine et de sa symétrie par rapport à la première bis- 
sectrice (cf. figure 4.7), il est préférable de calculer la probabilité du complémentaire : 


3/4 1 3/4 [3 9 
1-p=2/f ax | dy =2 | (-s)ar- 
0 x+1/4 0 4 16 


Ainsi p — L. 


3/4 1 
Figure 4.5 
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Exercice n°9 


1) Six < 0 ou y < 0 on a bien sûr F(x,y) = 0 puisque la densité est nulle dans toute 
cette zone du plan. Pour un point M(x,y) situé dans le triangle où f > 0, c’est-à-dire 
pour 0 < y < x < 2 on obtient (voir figure 4.6) : 


1 f? # 1 f? 
F(x,y) = | vd | udu = 1] v(x? — v?)dv 
2 Jo y 4 Jo 
1 x2y2  y{ y? 

= = 2 2 2 

An ae ee te 


Nous allons maintenant sortir du triangle, sur l’horizontale à droite de M(x,y) pour 
nous situer en un point M,(x,y) de coordonnées telles que 0 < y < 2 < x. La valeur 
de F en ce point est la même qu’au point d’intersection de l’horizontale avec la frontiè- 
re du triangle puisqu’au-delà f = 0, soit : 


y 
FG)= FQy) = LG — y?) 


Figure 4.6 


Si on sort du triangle sur la verticale de M pour atteindre un point M,(x,y) de coor- 
données telles que 0 < x < y et x < 2, on obtient de même : 
4 
F(x,y) = F(x,x) = a. 
| L 16 


Enfin, si x > 2 et y > 2, tout le triangle est recouvert et F(x,y) = 1. En résumé : 


0 si x < 0 ou y < 0 
1 
1e) 29 S0<y<x<2 
1 
F(x,y) = et Si0<x<2etx< y 
1 > 2 
16 $ y)  si0<y<2<x 
six >2ety >2 
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2) Les densités marginales s’obtiennent par intégration de la densité du couple ; pour 
0<x<72: 3 


__ x à d 2x 
ft = 5 [ PES 


et pour 0 y < 2 : 
2 
y } 2 
= — dx = =(4 
fr) Xax 1( y) 


Le produit fx(x) f;(y) est différent de f(x,y) donc les variables X et Ÿ ne sont pas 
indépendantes. 


3) La densité de Y sachant que X = x a pour expression quand 0 < y < x : 


Xy 4 2y 
ORNE SR 
Exercice n°10 


1) L'intégrale de f sur R? doit être égale à 1 ; elle se réduit à l’intégrale sur le domaine 
D où elle est non nulle : 


dxdy l'dx x [ 
1=k = bd = 2k 
he ol = . 


donc k — ; . Remarquons que si l’expression de f est symétrique en x et y, il n’en est pas 
de même du domaine D et il aurait été plus rapide ici d’intégrer d’abord par rapport à x. 


Si on note À le domaine défini par x <xo et y < yo, par définition 
F(xo, Yo) = J f, f(x,y)dxdy. Bien entendu, si xo < 0 ou yo < 0, A n’a aucun point 


commun avec D où f > 0, donc F(x0,70) = 0. Pour un point M(x0,yo) situé 
dans D maintenant (voir figure 4.9) c’est-à-dire tel que O0 < xo < yo < 1 


dxdy dx [7° dy 1 f" dx 
F(xo, = = = 2 24/x 
(%o, Yo) Î{.: mn A Ed e - 2e Je Yo — 2%) 


2 "& = Ddx = JC - D 
0 


M; XoY1) 


ET Éd M; (x1:Y0) 


Figure 4.7 
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Notons qu'ici il fallait d’abord intégrer par rapport à y, car sinon il aurait fallu séparer 
DNA A en deux domaines d’intégration. Pour les autres zones du plan, si nous quittons 
D sur une horizontale, à droite du point précédent, la valeur de F au point M\(x1, Yo) 
est la même qu’au point d’intersection avec la frontière de D, puisqu’au-delà f = 0, soit 
pour un point de coordonnées telles que x1 > yo > 0 et yo < 1 : 

F@:90) = F(30,Y0) = yo 


Si maintenant nous quittons le domaine D sur une verticale au-dessus du point 
M{xo,Yo), nous atteignons un point M; de coordonnées xo et y, avec 
0 < xo < 1 < y, eten ce point : 


FGo,y1) = F(xo,1) = VC — Vxo) 


Enfin, si xo > 1 et yo > 1, alors DA A = D et F(xo, yo) = 1. En résumé : 
0 six <O0ou y <0 
2/xy—-x S0<x<y<l 
FHy)= 4 2V/x-x s0<x<1<7y 
y S0<y<xety<l 
1 six >lety>l1 


2) On peut en déduire les f.r. marginales : 


0 six < 0 
Fx(x) = F(x,+o0) = 12/x-x s0<x<l 
1 si l<x 


0 siy<0 
Fy(y) = F(Hoo,y) = {y si0<y<l 
1 sil<y 


On en déduit les densités par dérivation ; pour 0 < x < 1 : 


1 
PS 


résultat que l’on peut retrouver par intégration de f : 


Dre he tas 


+00 


1 
road Ce [l 


—00 


WE: 


La loi de Ÿ est la loi uniforme sur [0,1], avec fy(y) = 1 si0 < y < 1. 
Comme fx(x) fy(y) Æ f(x,y) on en conclut que X et Y ne sont pas indépendantes. 


3) Les lois conditionnelles peuvent se définir par leurs densités. Pour 0 < yo < 1, quand 


O<x< y: 
f(,yo) _ 1 
fo) 24x30 


fx GIY = yo) = 


Pour 0 < xo < 1 et quand x < y < 1 : 


FO) 1 


X = xo) = _ 
FO! X0) fx(xo)  2(1 — /X)/7 
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On peut alors déterminer la régression : 


no 1 F Ms lon 26 0 
Ten. ë NC ENS LU DRE 


On calcule alors : 


A 1 
E[E(Y|X)] = A E(YIX = x)fx(x)dx = 3 . CA — x)dx = 5 
qui est bien la valeur de E(Y). 
Exercice n°11 
Les va. X et Ÿ ont la même densité f(f) = 35-110) et comme elles sont indépen- 


dantes, la densité du couple (X,Y) est f(x) f(y). Pour obtenir la densité du couple 
(X,Z) on effectue le changement de variable suivant : 


X=X 
z=Yy—x 
Les anciennes variables s’expriment alors par : 
X=X 
Y=z+x 


ce qui permet de déterminer le jacobien de la transformation : 
D(,y) _[1 0] 
D(x,2) 1 1 


Le couple (X,Z) a donc pour densité f (x) f (x + z) et la densité marginale de Z s’ob- 
tient par intégration : 


+00 


g@) = FX) f(x + z)dx 


—C 


L’intégrande sera non nulle si on a simultanément —1 < x < 1 et —1 —z < x < 1 —2z, 
soit max{—1,—1 — 7} < x < min{1,1 — z}. Nous allons distinguer deux cas : 


—siz <0: 


—1 —1l — 2 1 1 —Z 


la densité est non nulle pour —1 — z < x < 1, condition qui ne peut être réalisée que si 
—1—-Z<1,soitz > —2 ; dans ce cas: 


= | L ve 
«= | F #5 + 2) 


1—z 
—siz > 0: 
——_—_—#————@ 
—]1 —Z —] 1 —2z 1 


la densité est non nulle pour —1 < x < 1 — 7, condition qui ne peut être réalisée que si 
—1 <1—2Z,soit z < 2 ; dans ce cas: 
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: bee de 
= zd=:0-0 


On obtient ainsi : 
1 
—(2—1Z si —2<z<72 
= ha, 
0 sinon 
Exercice n°12 
1) L'argument de l'exponentielle dans la densité peut aussi s'écrire : 


(1 + a) (1 + da) x? 1 + 2a y? 
+2 Xy + 
2a 1 +4a (1+4da)(1 + a) 1+a 


L'exemple 4.1.3 montre que le couple (X,YŸ) suit une loi normale, donc les lois margi- 
nales de X et Y sont des lois normales centrées de variances respectives o? = 1 +4aet 


oÿ = 1 + a. Enfin, par identification on voit que : 
pe, 1 + 2a 
oxoy (1+4a)(1+a) 


1 +2a 
OxOY 
sont donc dépendantes. 


donc p = — et par conséquent Cov(X,Y) = —1 — 2a. Les variables X et Y 


2) La définition d'un vecteur normal implique que la combinaison linéaire X + Y suive 
une loi normale, avec : 


E(X+Y)=0etV(X+Y)=V(X)+2Cov(X,Y)+V(F)=a 


On en déduit que Z suit une loi x? étant le carré d'une v.a. de loi normale centrée et réduite. 


Exercice n°13 


La matrice Z est symétrique réelle, régulière et définie positive, donc il existe une matrice 
orthogonale S (ie. telle que S—! = ŸS) telle que S!ZS = D,où D est une matrice 
diagonale d’éléments À;,1 < i < n. Ainsi: 


Z='(X-p)E U(X — y) = (X—u)SD SX — y) 


Le vecteur Y = S—!(X — y) = !S(X — y) suit une loi normale centrée, de matrice 
variances-covariances V(Y) = S-1ZS = D qui est diagonale, donc ses composantes 
Yi,1 <i <n, sont indépendantes, de loi N(0,4/4;). On obtient alors : 


n | y? 
À 


ZSFD TE 
i=l 
qui est la somme des carrés de ñn v.a. normales indépendantes centrées et réduites, donc 
suit une loi x. 
On aurait pu également introduire la matrice À = D-!/?S-!, où la matrice D_!/? est 
la matrice diagonale d’éléments 1/4/X; , le vecteur U = D-!/2Y = A(X — 1) suivant 
n 


une loi normale standard, avec Z = 'UU — we U? + x2. Par ailleurs, si on pose 
B = A-!: i=1 


B'B = SD'?D'?$-12$Sps !'-% 
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donc la matrice Z peut s’écrire sous la forme B'B et le vecteur X sous la forme 
X = BU +, avec U - N,(0,1,). 
Exercice n°14 


La variable U est une combinaison linéaire de deux v.a. normales indépendantes 

et centrées, donc suit aussi une loi normale centrée, de variance 
1 

VU) = 51V(Xn) + VOX) = 1. 


De même, la va. U' — 5 (Xi + X2) suit une loi normale centrée réduite. D’autre part : 


AC DD) -(6) 

Y2\-1 1 X2 92 \X2 — Xi U 

suit une loi normale dans R?, comme image linéaire du vecteur normal de composantes 
X, et X2. Les composantes de ce vecteur normal sont telles que : 


Cov(U,U") = E(UU') = LE) — E(X?)]=0 


donc elles sont indépendantes. Ainsi, V = U'?/U? est le rapport de deux lois x indé- 
pendantes, donc suit une loi de Fisher-Snedecor F(1,1) (cf. chap. 5, IL, B). Le rapport 
W=U'/ VU? suit une loi de Student (cf. chap. 5, IL, A) à un degré de liberté, c’est-à- 
dire la loi de Cauchy. 


Si X est le vecteur normal de composantes X1,,X2 et X;, on peut écrire Y = ‘XAX en 
ayant posé : 


1 5. 2 1 
ie 2 2 2 
—1 2 5 


La matrice À étant symétrique et idempotente (A? = A), avec rang A = traceA = 2, 
on en conclut que Ÿ suit une loi x; . 


D'autre part, Z = XX —Y = 'X(I— A)X + x? car 1 — A est une matrice symé- 
trique idempotente, de rang égal à sa trace, c’est-à-dire un. De plus : A(7 — A) — 
A—A2=A—A=O, donc YŸ = ‘XAX et Z = ‘X(I — A)X sont indépendantes. 
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oi empirique 


i le hasard conduit à un résultat non prévisible, l'observation de 

plusieurs résultats d'une même expérience aléatoire permettra 

cependant de choisir judicieusement le modèle aléatoire à retenir. 
En jetant un dé plusieurs fois consécutivement et en notant le résultat à 
l'issue de chaque jet, nous obtenons une suite de nombres entiers com- 
pris entre un et six, obtenus dans les mêmes conditions et de façon indé- 
pendante, que nous pourrons appeler échantillon de la loi associée à un 
jet de dé, qui est on le sait la loi uniforme sur l'ensemble {1, 2, 3, 4, 5, 6}. 
Si on calcule la fréquence (pourcentage) observée de chacun de ces 
chiffres, pour un nombre suffisament élevé de lancers, on obtiendra une 
distribution empirique (c'est-à-dire obtenue par l'observation) de 
valeurs proches les unes des autres et proches de la valeur 16,7 %. Ceci 
nous oriente donc vers la loi théorique qui est la loi uniforme attribuant 
la même probabilité 1/6 aux chiffres 1, 2, 3, 4, 5 et 6. C'est donc à partir 
d'observations qui vont constituer ce qu'on appelle un échantillon qu'on 
pourra déterminer la distribution empirique nous permettant de retenir 
la distribution théorique qui lui ressemble le plus, dans la liste des lois 
usuelles vues au chapitre 3. Les tests d'adéquation nous donnent des cri- 
tères précis permettant de retenir une loi théorique pour le modèle, qui 
paraisse raisonnable compte tenu des observations recueillies. 


Objectif du chapitre : introduire la notion d’échantillon, définir les lois de 
Student et de Fisher-Snedecor associées à un échantillon gaus- 
sien et présenter deux tests d’adéquation à une loi donnée. 

Concepts clés étudiés : échantillon, loi empirique, fonction de répartition 
empirique, moments empiriques, test du khi-deux, test de 
Kolmogorov-Smirnov. 
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chantillon d'une loi 


On appelle échantillon de faille n d'une loi de probabilité P, une suite 
(X1,...,X,) de variables aléatoires indépendantes et de même loi de probabili- 
té P. On dit que P est la loi parente de l'échantillon. Pour tout w de 2, la réali- 
sation correspondante de l'échantillon se note (x:1,...,x,), ayant posé 
x; = X;(w),1 < i <n. Cette réalisation particulière étant parfois aussi appelée 
échantillon, on peut alors préciser dans le premier cas en disant que (X:,...,X,) 
est un échantillon aléatoire. Si X est une v.a. de loi P, on dit également qu'il 
s'agit d'un échantillon de la variable aléatoire X. 


À partir d'un échantillon (X:,...,X,) de X, nous définirons la loi de proba- 
bilité empirique P,, qui sera la distribution uniforme sur l'ensemble fini des 
valeurs (X,,...,X,), c'est-à-dire qui attribue la même masse de probabilité 1/n 
à chacun des points X;,1 < i < n, et qui peut se noter sous la forme : 


où 6, est la masse de Dirac au point a. Ainsi, pour tout intervalle 7 de R, sa pro- 
babilité est égale au pourcentage de points de l'échantillon qui appartiennent à 
cet intervalle : 


1 n 
PQ) = = > Lx) 
i=1 


Cette loi de probabilité admet une fonction de répartition, notée F,, appelée 
fonction de répartition empirique et définie pour tout réel x par : 


X 1 n 
F,G) = Î dP, = P,(-00xD) = = D Ti-x(Xi) 
—œ i=1 


qui représente le pourcentage de points observés qui sont situés avant x. Les v.a. 
n 
X:,...,X, étant indépendantes, la va. nF,(x) = >. 1%: (X;) suit une loi 


binômiale de paramètres n et F(x) puisque c'est la Somme de n variables indé- 
pendantes de Bernoulli, de paramètre P (Lio: (X5) = 1) = P(X; e ]—c,xl[) 
— F(x). Ainsi: 


ELE, (x)] = F(x) et V[F, (x)] = LFG) [1— F(x)] — 0 quand n — 0. 
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oments empiriques 


La loi de probabilité empirique P, admet des moments de tous ordres que l'on 
nomme moments empiriques où moments de l'échantillon et qui seront tous des 
variables aléatoires. 


oyenne empirique 


La moyenne de l'échantillon aléatoire est la moyenne de la loi empirique, c'est- 
à-dire l'espérance d'une loi uniforme discrète qui affecte le même poids 1/n à 
chacune des valeurs X; et notée : 


_ LE 
X, = — X,; 
Cette v.a. admet comme espérance : 
— 1 À 
EX,)=-ŸN E(X)=E(X)=m 
n i=1 


et comme variance : 


= 1 À V(X 2 
vE)= = Dvan= D LT 
i=1 


n n 


Ainsi, X, a la même moyenne que X, mais avec une variance qui est divisée 
par la taille de l'échantillon. Les autres moments centrés de X, ont pour expres- 
SIONS : 

n—1l 


ER, -m} = et EX, — mt = +3 — 0 
n n n 


ariance empirique 


La variance de la loi empirique est celle d'une loi de moyenne X, et qui attribue 
le même poids 1/n a chacune des valeurs X;, soit : 


1 n 


= -)(x-x) 
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Pour calculer les moments de cette variable aléatoire, nous allons l'exprimer 
à l'aide des v.a. centrées en écrivant X,; — X, = (X; — m) — (X, — m) 


n 


S'G-x) = Gin) nm) 2%") ) mn) 


i=1 


d'où on déduit : 
x 1% 2 — 2 
ST = = > (X; — m) — (X, — m) 


Ceci permet d'obtenir aisément l'espérance de ce moment empirique : 


RP VE 


E(S2)= E(X—m} —E(X,-—m) = V(X) — V(X,) = o 


La valeur moyenne de la variance empirique n'est pas exactement égale à la 
variance théorique, c'est pourquoi on introduit la variance empirique modifiée 
(ou corrigée) où on divise non pas par le nombre de termes de la somme, mais 
par le nombre de termes indépendants, puisqu'ils sont liés par la relation 

n 


D(G-X,)=0 : 


i=1 1 ñ 


où 4 = E(X — m)*. Pour la variance empirique on obtient : 
(n — 1} à He, ; 
Fe (124 Oo ) +2 5 o 


V(SS) = 


On peut également préciser le lien existant entre moyenne et variance empi- 
riques par le calcul de la covariance : 

n— 

7e 


F4 
n 


Cov (X,557) = be et Cov (X,,52?) = 


Aïnsi, pour toute loi symétrique, on a : Cov (X,,57) = 0. 
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oments empiriques 


Le moment non centré d'ordre k € N* de cette loi empirique est : 


1 S | 
Mn — F _ 6 
avec E(myn) = E(X*) = m4 et : 


1 1 1 
V Gun) = VA = [EX — Ex] = (mx — mi) 


n 


Le moment centré d'ordre k € N* de cette loi empirique est : 


chantillon d'une loi normale 


Nous allons étudier le cas particulier où la v.a. X suit une loi normale N(m,0). 


La moyenne empirique étant une combinaison linéaire de v.a. normales indé- 
pendantes suit aussi une loi normale : 


nv (5) 


La variance empirique est construite à partir des variables : 


qui sont des combinaisons linéaires de variables normales indépendantes donc 
sont aussi des variables normales, d'espérance E (X — X;) = E(X;) — E(X,) 
—0 et de variance V(X;,—X,)=E (X; — X,) = E(S”?) car toutes ces 
variables ont la même loi. La variable nS”? est la somme des carrés de n 


n 
variables normales centrées qui sont liées par la relation >. (X i X,) =0et 
on peut démontrer que : i=1 


12 
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à pe n—1 cs 
On retrouve bien le résultat général E(S?) = o? et on obtient ici, 


— 1 
d'après les moments de la loi du khi-deux, V(S7?) = D 64 Pour la variance 
n 
4 


empirique modifiée : E(S?) = a? et V(S?) = 


' La loi normale étant 


symétrique, moyenne et variance empiriques sont bien entendu non corrélées, 
mais de plus elles sont indépendantes et c'est une propriété caractéristique de la 
loi normale. Ce résultat s'énonce de la façon suivante : 


Théorème de Fisher 


Les va. X,,...,X, forment un échantillon d'une loi normale si et seule- 
ment si les v.a. X, et S°? sont indépendantes. 


oi de Student 


Nous avons vu que : 


= 
TR SN OU 
© 


Dans le cas où o est un paramètre inconnu, on peut le remplacer par l'écart 
type empirique modifié, ce qui amène à considérer la variable : 


—m_{(X,-m)/(o/Vn) 
Sy / S? / © 2 
Le numérateur suit une loi normale centrée réduite et le dénominateur est la 
racine carrée de la variable : 


> ARE 1)5?/o°? 


o? n—l 


qui est donc une variable de loi x?_,, divisée par son nombre de degrés de liber- 


té. D'après le théorème de Fisher, le numérateur et le dénominateur sont des v.a. 
indépendantes et leur rapport définit une nouvelle loi de probabilité, usuelle en 
statistique, appelée loi de Student à n — 1 degrés de liberté. Au-delà de ce cas 
particulier lié à un échantillon gaussien, on peut définir cette loi à partir d'une 
va. U de loi N(0,1) et d'une autre v.a. indépendante Y de loi x?. Le rapport 
U/V/Y/n suit une loi de Student à n degrés de liberté, notée 7,. Comme le 
numérateur U suit une loi symétrique par rapport à 0, il en de même de T,, avec 


E(T,) = 0 pour n > 1. On obtient aussi V(T,) — —— pour ñn > 2. 
n — 
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Le cas particulier n — 1 correspond au rapport de deux variables normales 
indépendantes qui suit une loi de Cauchy, qui possède la particularité assez rare 


de n'admettre aucun moment. En effet, sa densité est el le calcul de 
l'espérance conduit à l'intégrale généralisée : TA + x) 
1 f'° xdx 1 Rs 
E(X) = = In(1 + x? 
= 1 + x2 Ge LL le 


intégrale divergente car cette quantité n'est pas définie, donc l'espérance d'une 
loi de Cauchy n'existe pas. 


oi de Fisher-Snedecor 


En présence de deux échantillons (X:,...,X,) et (Y:1,...,Y,) auxquels sont 
associées les variances empiriques $”? et S°?, on peut se poser la question de 
savoir s'ils proviennent de deux lois normales ayant la même variance, et pour 
cela former le rapport S?/S°. Si effectivement ces deux lois ont la même 
variance, ce rapport de deux lois du khi-deux indépendantes, réduites (divisées) 
par leur nombre de degrés de liberté (car s'écrivant [U/(n — 1)]/[V/(m —1)] 
avec U = (n — 1)S?/o°? et V = (m — 1)S$?/o?), définit une nouvelle loi usuel- 
le en statistique, appelée loi de Fisher-Snedecor. Plus généralement, si U et V 
sont deux v.a. indépendantes de lois respectives x? et x?, alors le rapport 
(U/n) / (V/m) suit une loi de Fisher-Snedecor à n et m degrés de liberté, notée 
F(n,m). On obtient comme moments : 
m 2m? (n + m — 2) 
E[F(n,m)] = —,m > 2et V[F(n,m)] = : ,m > 4 
m —2 n(m — 2)" (m — 4) 

53) et T? F(Ln). 

Les fractiles de cette loi sont tabulés (table 7) pour certains couples (n,m) ; 
si le couple (n,m) cherché ne figure pas, mais si le couple (m,n) est dans la 
table, on utilise le fait que (V/m) / (U/n) -F(m,n). 


On peut remarquer que : a Fm) = Bri( 
m 


Exemple 5.1 
Pour à donné, cherchons le fractile f, (n,m) de F(n,m) défini par : 
a = P{F(n,m) < f,(n,m)} = P fe Le Gun] 
V/m 
Pie : j=Plrmme 
U/n  f.(n,m) Ja ,m) 


=1- Pr ümm < rs) 
fa (n,m) 
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on voit ainsi que 1 —œ = P{F(m,n) <1/f,(n,m)} et par conséquent 
1/f, (n,m) est le fractile f;_,;(m,n), d'ordre 1 — «, de la loi F (m,n). 
Appliquons ceci à la recherche du fractile d'ordre 0,025 de la loi 
F(15,10), défini par : 


1 
0,025 = P{F (15,10 15,10); = P£F (10,15 a 
{F( ) < 0.025 ( )} ( = ee ss) 
d'où on déduit 0,975 = P {F (10,15) < 1//f0025 (15,10)} ; on lit dans la 
table 7 la valeur du fractile fo,915 (10,15) = 3,06 d'où la valeur cherchée : 


1 
15,10) = —— = 0,327. 
0,025 (15,10) 3.06 05 


ests d'adéquation 


L'examen de la loi de probabilité empirique associée à un échantillon dont la loi 
parente est inconnue permet de choisir parmi les lois usuelles celle qui lui « res- 
semble » le plus. Si notre choix s'oriente vers une certaine loi P de fonction de 
répartition (f.r.) F, on pourra retenir l'hypothèse que l'échantillon provient de 
cette loi si la distance entre la fr. théorique F et la fr. empirique F, est faible. 
Ayant fait le choix d'une certaine distance d entre fonctions de répartition, on se 
fixera une règle de décision qui s'énonce ainsi : « Si l'événement d (F,,F) < C 
est réalisé, alors je retiens l'hypothèse qu'il s'agit d'un échantillon de la loi de fr. 
F ». On peut cependant se tromper en rejetant cette hypothèse alors que F est 
bien la fr. des variables de l'échantillon; cette erreur se produit avec une proba- 
bilité qui est &« = P{d(F,,F) > C}. Si on veut que ce risque d'erreur soit 
faible, on fixera une valeur æ@ faible à cette probabilité (par exemple 5 % ou 
1 %) et cette valeur permettra alors de préciser la valeur de la constante C qui 
apparaît dans la règle de décision, si on connaît la loi de probabilité de la v.a. 
d(F,,F). Nous aurons ainsi réalisé un test d'adéquation, ou d'ajustement, entre 
une loi théorique donnée et une loi empirique associée à un échantillon d'obser- 
vations. La fixation du risque & déterminera alors la valeur du seuil d'accepta- 
tion, ou seuil critique C. Nous allons présenter maintenant deux tests, associés à 
deux distances entre f.r., permettant de déterminer la loi approchée de la va. 
d(F,,F) pour toute fr. F, le premier étant plutôt destiné aux lois discrètes et le 
second réservé aux lois continues. 


est du khi-deux 


Ce test est à retenir si les données sont discrètes, avec des valeurs possibles 
notées x;, de probabilité p;, pour 1 < i < k, ou si les données individuelles ne 
sont pas fournies, mais ont été réparties en classes (a;,a;,.) dont les fréquences 
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théoriques sont calculées à partir de la loi théorique postulée : 
pi= PIX E (a,a)} = Fais) — Fa) 


Si N; est le nombre (aléatoire) d'observations x;, ou appartenant à la classe 
(a;,4;:1), nous allons le comparer à l'effectif théorique qui est np;. La distance 
euclidienne classique entre F,, représentée par les k effectifs observés N;,et la 


fr. F, représentée par les K effectifs théoriques np;, serait D, (N, — np). 
i=1 
Cependant, comme cette distance ne permet pas de déterminer la loi asymp- 
totique de cette v.a., on préfère retenir une autre distance. Cette dernière sera 
déterminée à partir de la remarque que les v.a. N; suivent des lois binômiales de 
paramètres n et p; et que les variables centrées (N; — np;) //np; convergent 
vers vers la loi N (0,1 L pi) . On retient donc la distance : 


k 2 
(N; — npi) 
BREL RD 


et cette somme de carrés de v.a. centrées qui sont asymptotiquement normales 
k 


et liées par la relation ÿ (N; — np;) = 0 converge vers une loi x?_,. La valeur 
i=1 

de C'est alors déterminée approximativement, en utilisant cette loi asympto- 
tique, comme le fractile d'ordre 1 — & de la loi du khi-deux à k — 1 degrés de 
liberté. Cette approximation est justifiée si n est assez grand et p; pas trop petit, 
avec comme règle empirique np; > 5. Si ce n'est pas le cas à cause d'une valeur 
de p; trop petite on doit regrouper des classes (ou des valeurs) contiguës. Pour 
le calcul de la distance, il est préférable d'utiliser la formule développée : 


Exemple 5.2 


Ayant demandé à dix personnes de fournir chacune dix chiffres choisis au 
hasard, on souhaite savoir si effectivement les cent chiffres obtenus for- 
ment bien une distribution au hasard. L'hypothèse à tester ici est donc 
celle d'une loi uniforme discrète sur l'ensemble des dix chiffres 
{0,1,...,9}, donc avec des probabilités égales pour chacune de ces 
valeurs, p; = 1/10 pour i —0,1,...,9. Le tableau ci-après contient la 
distribution empirique (observée) sur la deuxième ligne et la distribution 
théorique sur la troisième. 


x [0 1 23 4 5 6 7 8 9 
N; [10 8 9 14 8 9 11 9 12 10 
np; |10 10 10 10 10 10 10 10 10 10 
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On obtient comme distance : 


1 
TE 


le fractile d'ordre 0,95 de la loi du khi-deux à neuf degrés de liberté est 
C = 16,9 donc la valeur de la distance est très inférieure et on peut 
accepter l'hypothèse d'une répartition uniforme. 


Cependant, dans beaucoup de cas, si le type de loi est précisé, la loi dépend 
de paramètres dont la valeur n'est pas spécifiée et qu'il va falloir estimer pour 
pouvoir calculer les fréquences théoriques p;. Si on doit estimer r paramètres, 
cela diminue d'autant le nombre de degrés de liberté qui devient alors n — 1 —r. 


Exemple 5.3 


On a observé pendant deux heures le nombre de voitures arrivées par 
minute à un poste de péage. Si X est la v.a. représentant le nombre de voi- 
tures arrivant dans une minute à ce poste de péage, on fait l'hypothèse 
qu'elle suit une loi de Poisson. Le tableau ci-après contient les valeurs 
observées x; de cette variable et le nombre d'observations correspon- 
dantes N;. Pour calculer les probabilités théoriques p; = P (X = x;) il 
faut spécifier complétement la loi, c'est-à-dire indiquer le paramètre de 
cette loi de Poisson. Le calcul de la moyenne empirique donne x = 3,7 et 
la variance empirique a pour valeur 4,41. On retient alors la valeur entiè- 
re 4 comme paramètre de cette loi de Poisson. Les valeurs de np; sont 
alors obtenues par lecture de la table 4 et arrondies à l'entier le plus 
proche, en vérifiant bien que le total est égal à n = 120 ; par exemple 
nP(X = 3) = 120 x 0,1954 = 23,448 est arrondi à 23. 


x [O0 1 2 3 4 5 6 7 8 9 10 11 
N;, [4 9 24 25 22 18 6 5 3 2 1 1 
np, 12 9 18 23 23 19 13 7 3 2 1 0 


Les valeurs des effectifs théoriques inférieures à 5 nécessitent de regrou- 
per les deux premières et les quatre dernières valeurs, ramenant à 8 le 
nombre de valeurs retenues, soit 8 — 1 — 1 = 6 degrés de liberté puis- 
qu'un paramètre a été estimé. Le fractile d'ordre 0,95 de la loi du khi-deux 
à 6 degrés de liberté est C = 12,6. On obtient d(F,,F) — 7,14 ce qui 
conduit donc à accepter l'hypothèse que X suit une loi de Poisson de para- 
mètre 4. 
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est de Kolmogorov-Smirnov 


Dans le cas d'une variable continue pour laquelle on dispose des données indi- 
viduelles, il est préférable d'utiliser toute l'information disponible et de ne pas 
regrouper les observations en classes. On retient alors la distance de 
Kolmogorov, ou distance de la convergence uniforme, définie par : 


K, = d(F,,F) = suplF,(x) — F(x)l 
xeR 


Là encore, on retiendra l'hypothèse que la loi parente admet F comme fr. si 
cette distance est faible, c'est-à-dire plus précisément si l'événement 
d(F,F) < C est réalisé. La valeur de C sera déterminée par la fixation du risque 
d'erreur à = P{d(F,,F) > C} et en utilisant la loi limite de la va. /nK, qui 
admet pour fr. la fonction K définie pour x > 0 par: 


+00 & 
K(x) = + (1e 2 = 1 — AD EDar 
= pe 


Les valeurs de K sont tabulées, permettant de déterminer les fractiles de la 
loi. Les valeurs de C sont données en fonction de & dans la table suivante : 


n @ = 0,10 | œ = 0,05 | & = 0,01 

0,509 0,563 0,669 
10 0,369 0,409 0,486 
15 0,304 0,338 0,404 
20 0,265 0,294 0,352 
25 0,238 0,264 0,317 
30 0,218 0,242 0,290 
40 0,189 0,210 0,252 

n > 401) 1,22//n | 1,36//n | 1,63//n 


Pour le calcul pratique de cette distance, on utilise la définition de F, faisant 
intervenir l'échantillon ordonné X4, < X4, <... < X4,,. L'expression de 
FE,(x) = P, {]—-c,x[} s'écrit alors : 

0 si x<X( 


FD == 


si XG-n <X< X 


1 Si X > X(n 


Loi empirique ©e 159 


On calcule au préalable les statistiques : 


d'(P,,F) = sup [F,(x) — F(x)] = max É El (xu)} 
xeR <i<n 


DA 


car F, est constante sur chacun des intervalles délimités par les points de 
l'échantillon ordonné : 


i . i 
sup [AG)-FGN=--, inf  F(&)=-—F(X6 +0) 
*EIX (GX (G+1)] n KG) X<X (G+1) n 
i 
= — — F X; 
= F(Xu) 


On calcule ensuite : 
d(F,,F) = max{d*(F,,F) ,d*(F,F,)} 


Exemple 5.4 


On se pose la question de savoir si les données suivantes peuvent prove- 
nir d'une loi normale centrée et réduite : 

6,42; —5,23; —1,25; 0,12; —0,01; —1,02; 18,54; 0,06; —7,64; 2,85; 

— 1,84; 0,74; —0,65; 0,24 

Disposant des données individuelles, nous allons utiliser le test de 
Kolmogorov-Smirnov et pour cela ordonner les observations par valeurs 
croissantes x, puis calculer les valeurs D (xx) à l'aide de la f.r ® de la 
loi N (0,1). Les valeurs permettant le calcul de la distance entre loi empi- 
rique et loi théorique figurent dans le tableau suivant : 


i i-] 
X() D (xx) ——D{xé) |P (xx) — 
n n 
— 7,64 0 0,0667 0 
— 5,23 0 0,1333 — 0,0667 
— 1,84 0,0329 0,1671 — 0,1004 
— 1,25 0,1056 0,1611 — 0,0944 
— 1,02 0,1539 0,1794 — 0,1128 
— 0,65 0,2578 0,1422 — 0,0755 
— 0,01 0,4960 — 0,0293 0,0960 
0,06 0,5239 0,009 0,0572 
0,12 0,5478 0,0616 0,0145 
0,24 0,5948 0,0719 — 0,005 
0,74 0,7704 — 0,0371 0,1037 
2,18 0,9854 — 0,1854 0,2521 
2,85 0,9978 —0,1311 0,1978 
6,42 1 — 0,0667 0,1333 
28,54 1 0 0,0667 
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On lit dans les deux dernières colonnes du tableau les valeurs maximales 
d'(F,,F) = 0,1794 et d*(F,F,) = 0,2521 d'où on déduit d (F,,F) — 
0,2521. Pour un risque à = 0,10 on lit dans la table 5.1, pour n = 15, 
le seuil critique € = 0,304 donc on accepte l'hypothèse d'une loi parente 
N (0,1), bien que la valeur de la distance soit proche du seuil de rejet de 
cette hypothèse. 


À retenir 


Un échantillon d'une loi P, ou d'une v.a. X, est un ensemble de v.a. indé- 
pendantes et de même loi P, ou de même loi que la v.a. X. 


La loi uniforme qui attribue la même probabilité — à chacune des n 
n 


observations d'un échantillon est appelée loi empirique et ses moments, 
moments empiriques. On étudie plus particulièrement la moyenne et la 
variance empiriques. Les moments empiriques sont des fonctions de 
l'échantillon, donc à ce titre sont aussi des v.a. qui admettent des moments 
théoriques. 


À partir de la fonction de répartition empirique on peut effectuer un test 
permettant de savoir si on peut retenir pour le modèle théorique une certai- 
ne loi de probabilité donnée. Dans le cas de données discrètes ou regrou- 
pées en classes, on utilise comme test d'ajustement le test du khi-deux. Pour 
des données individuelles issues d'une loi continue, il est préférable d'utili- 
ser le test d'adéquation de Kolmogorov-Smirnov. 


Compléments 


tatistique d'ordre 


La statistique d'ordre associe à un échantillon (X:,...,X,) d'une loi de fr. F et de den- 
sité f, les observations classées par ordre croissant : X(1, <... < X(,). Elle a pour den- 
sité : 


nie, (t1,...,Xn) El f Gi) 
ET 


Où Cn = {(X1,... ,Xn) /X1 <<... < Xy}. 
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Les valeurs extrêmes sont X(1,, de fr. définie par G1 (x) = 1 —[1 — F(x)]", de 
densité g1 (x) = nf (x)[1—F (x)1—!, et X(n), de fr. définie par G, (x) = F" (x), 
de densité g, (x) = nf (x) F1 (x). 


La loi de l'étendue (range) W, = X4,, — X() se déduit de la loi du couple 
(X«,X@) , de fr. définie pour x < y par: 
Gun» =FrG)-FH-FG)r 


au moyen du changement de variable x = x et w = y — x. On obtient comme f.r. pour 
w > 0: 


H (w) — "| LF + uw) — F GT! f G&)dx 
R 
et comme densité : 


h(w)=n(n— ù | LF + uw) — F1" f + w) f (x) dx 
R 
Si le support de la loi est R, l'expression des fr. des valeurs extrêmes montre que : 
Xa, — —o et X4, —> +oo 
P.Co. p.co. 
Si le support est l'intervalle (a,b) on obtient de même : 


X() —+ d Êet X(n) — b 
P-.co. 


P-co. 


Si la loi admet une espérance, on établit également que : 


X X 
a 
np np 


(voir le chapitre 6 pour la définition de ces convergences). 


Pour obtenir la loi de X4,, 1 < k < n, il suffit de remarquer que le nombre N, (x) 
de variables de l'échantillon qui sont inférieures au réel x vérifie : 


NA>kS XH <x 


Comme N, (x) ->B(n,F (x)) on en déduit la fr. G4 de X4, définie par : 


n 


G@= (CF QU - F GT 


= 


et sa densité peut être obtenue de façon « intuitive » comme probabilité qu'un élément de 
l'échantillon soit compris entre x et x + dx, soit f (x), que k — 1 soient situés avant x, 
soit F#-1 (x), que n — k soient situés après x, soit [1 — F GITE, avec un nombre de 
permutations n! des variables de l'échantillon qui doit être divisé par le nombre (k — 1)! 
de variables avant et (n — k)! de variables après, soit : 


n! 


- k—1 _— n—k 
éd PHP FE 


&k (x) = 
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On peut également exprimer la fr. de X{4, au moyen de l'intégrale bêta incomplète : 


1 F(x) 
Gx (x) = 5-15 | KT np" KE ar 
Ban =kTD 


et retrouver ainsi par dérivation l'expression de la densité. 


En utilisant le résultat de l'exercice 2.11 qui a montré que F (X) - U([0,1]) eten 
faisant le changement de variable y = F (x), on établit alors que : 


F(X&) — Brn—k+1. 


héorème de Fisher 


À partir d'un échantillon de n v.a. de la loi N (0,1), on construit le vecteur X de coor- 
données (X1,...,X,) dans la base canonique (e,...,e,) de R”. Sa projection sur le 
vecteur bissecteur u = (1,...,1) est le vecteur X — (X,,... X) . Si on effectue un 
changement de base orthonormée au moyen de la matrice orthogonale P, en choisissant 


u 
dans la nouvelle base (f1,...,f,) le vecteur unitaire f, = Dr le vecteur des nouvelles 
n 


coordonnées de X est Y = ‘PX, avec Y, = 4/nX,. On obtient ainsi : 


n—1 
X-X=X-Nf = Yf= D Xe — VX De 
j=l 
Dre 
i=1 


D'autre part : 


VO)=VCPA) = PV OUR =TPP= 1, 
n—]l 
nee > 2 I2 
donc Y, est indépendant de Y:,...,Ÿ,-_1 et par conséquent de > y; = x — X| = 
j=1 
n : 

— 2 | Nr A ER ; 
> (X — X,) , ce qui établit l'indépendance de X, avec 53 (X — X,) et le fait 
i=1 i=1 
que cette dernière variable suit la loi pt comme somme des carrés des ñn — 1 
variables Ÿ1,...,Ÿ,-1 qui sont indépendantes et de même loi N (0,1). 
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Exercices 


noncés 


Exercice n°1 
Déterminer les fractiles d'ordres 0,90 et 0,05 de la loi de Student 735. 


Exercice n°2 
Déterminer le fractile d'ordre 0,05 de la loi de Fisher-Snedecor F (30,20). 


Exercice n°3 

Le tableau ci-après contient les fréquences absolues N; d'apparition des entiers x; de 0 à 
9 dans les 10 000 premiers chiffres de la partie décimale du nombre x. On demande de 
tester l'hypothèse d'une répartition uniforme de ces entiers. 


Xi 0 1 2 3 4 5 6 7 8 9 
N; | 968 1025 1021 974 1014 1045 1021 970 948 1014 


Exercice n°4 


Pour vérifier si un ensemble de deux dés n'est pas truqué, on les jette 108 fois. La somme 
des chiffres obtenus a pris les valeurs 6, 9 et 11 respectivement 12, 15 et 8 fois. Peut-on 
accepter l'hypothèse de l'équilibre de ces dés, en prenant comme risque de première espè- 
ce œ = 0,05 ? 

Exercice n°5 

Le tableau ci-après fournit la distribution du nombre X d'accidents graves par semaine à 


un carrefour dangereux, relevés pendant une certaine période. On demande de tester l'hy- 
pothèse que la loi parente de X est une loi de Poisson de paramètre À = 2. 


X | 0 1 2 3 4 5 
Ni |5 10 7 4 3 1 


Exercice n°6 

Un organisme de défense des consommateurs a prélevé au hasard 200 boîtes de conserve de 
haricots verts pour tester la validité de l'étiquetage indiquant un poids net égoutté de 560 g. 
La distribution observée du poids égoutté X en grammes figure dans le tableau suivant : 


X N; 
[530,540f 14 
[540,545T 15 
[545,550[ 29 
[550,555T 40 
[555,560f 37 
[560,565T 27 
[565,570[ 20 
[570,580[ 18 


On demande de tester l'hypothèse que X suit une loi N (555,10). 
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Exercice n°7 
Peut-on accepter l'hypothèse que les données suivantes proviennent d'une loi 


N(1,5; D? 
2,51 ; 1,45 ;0,71 ; 0,25 ; 2,35 ; 0,00 ; 2,06 ; 1,95 ; 0,41 ; 2,75 ; 0,78 ; 1,01 ; 1,75 ; 2,32 ; 1,36. 


orrigés 


Exercice n°1 


La table 6 fournit la valeur 1,316 dans la colonne 0,90 et, du fait de la symétrie de cette 
loi, le fractile d'ordre 0,05 est obtenu dans la colonne 0,95 en changeant le signe, soit 
— 1,708. 


Exercice n°2 


La table 7 ne comporte pas le couple de degrés de liberté (30, 20) mais comporte le 
couple (20, 30) ; nous allons voir comment nous y ramener. Par définition, la loi F(n,m) 


où X et Y suivent des lois du khi-deux à respectivement 


| Y/m 
n et m degrés de liberté. Par conséquent — — 
U  X/n 


F(m,n). La valeur u cherchée est définie par : 0,05 = P(U <u) = P (1/U > 1/u), 
avec U de loi F(30,20), ou P(1/U < 1/u) = 0,95 donc 1/u est le fractile d'ordre 
0,95 de la loi F (20,30), valeur lue dans la table 7, soit 1/u = 1,93 et u = 0,518. 


X/n 
est la loi du rapport U = 
Y/m 


suit une loi de Fisher-Snedecor 


Exercice n°3 


Si la répartition des entiers est uniforme, chaque entier x; a la même probabilité 
Pi = 1/10 et tous les effectifs théoriques ont la même valeur np; = 1000. On calcule 
la distance du khi-deux d(F,,F) —=9,37 que l'on compare au seuil critique 
C = 16,92 associé au risque & = 0,05. Même pour un risque plus élevé & = 0,10 le 
fractile d'ordre 0,90 de la loi xè est C = 14,68 et on accepte encore l'hypothèse d'une 
répartition uniforme de ces entiers. 


Exercice n°4 


Tester l'équilibre de cet ensemble de deux dés revient à tester l'adéquation de la loi empi- 
rique avec la loi théorique en cas d'équilibre. Comme seulement trois valeurs de la 
somme S sont données, on va regrouper toutes les autres valeurs possibles. Les 4 valeurs 
théoriques retenues sont donc : 


5 4 2 

P(S=6 —, P(S=9 —, P(S=II —, 

Pi ( ) 36" P2 ( ) 36 7: ( ) 36 
25 
36 


On peut donc constituer le tableau de comparaison des distributions empirique et théo- 
rique : 


Pa = 1— pi — p2— p3 = 


Xi 6 9 11 autre 


ñi 12 15 8 73 


nPi 15 12 6 75 
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La distance entre ces deux distributions a pour valeur : 


(12—15) (15—12) (8—6) (73-75) 
D, = 
15 + Be Top rit 7 


Le fractile d'ordre 0,95 de la loi du khi-deux à 4 — 1 = 3 degrés de liberté a pour valeur 
7,8 donc on accepte l'hypothèse de l'équilibre de ces dés, en prenant comme risque de 
première espèce & = 0,05. 


= 2,07 


Exercice n°5 


On calcule les effectifs théoriques np; arrondis à partir des probabilités de la loi de 
Poisson P (2). Pour obtenir des effectifs suffisants on doit regrouper les deux dernières 
classes ; on obtient le tableau suivant : 


Xi 0 1 2 3 4ouplus 
N,; 5 10 7 4 4 
npi | 4 8 8 5,5 4,5 


On obtient d (F,,F) = 1,49 valeur qui est inférieure au fractile d'ordre 0,95 de la loi 
xè qui vaut C = 9,49 donc on accepte l'hypothèse que ces observations forment un 
échantillon d'une loi de Poisson P (2). 


Exercice n°6 


Les données étant regroupées en classes, on effectue le test du khi-deux en calculant les 

effectifs théoriques np; où ñn = 200 etp; = P(X Ee[a;,a;,1[) se calcule à partir de la 

fr. ® de la loi N (0,1) en centrant et réduisant les observations. Par exemple : 

5 X—555 10 
< < 

10 10 10 

et 200 x 0,1498 — 29,96 est arrondi à 30. Les classes extrêmes [530,540[ et 


[570,580[ sont assimilées respectivement aux classe ]—00,540[ et [570,+o01. 
Le calcul de la distance du khi-deux se fait à partir du tableau suivant : 


P(SG0< X < 565) P ( }= #0 - 600.5 = 0.148 


X N; | np; 
[530,540 14 13 
[540,545 15 18,5 
[545,550[ 29 30 
[550,555 40 | 38,5 
[555,560 37 38,5 
[560,565 27 30 
[565,570[ 20 18,5 
[570,580 18 13 


On obtient d (F,,F) = 3,23 que l'on compare au fractile d'ordre 0,95 de la loi x qui 
vaut C = 14,07. On accepte donc l'hypothèse de données provenant d'une loi 
N (555,10), donc d'une loi dont la moyenne est inférieure de 5 g à la valeur indiquée 
sur la boîte. 


166 e STATISTIQUE ET PROBABILITÉS 


© Dunod. Toute reproduction non autorisée est un délit. 


Exercice n°7 


Disposant des données individuelles, nous allons utiliser le test de Kolmogorov-Smirnov 
et pour cela ordonner les observations par valeurs croissantes x, puis calculer les 
valeurs centrées (et réduites) #4) = x) — 1,5 pour pouvoir calculer ensuite ® (u) à 
l'aide de la fr. D de la loi N (0,1). Les valeurs permettant le calcul de la distance entre 
loi empirique et loi théorique figurent dans le tableau suivant : 


i i—] 
ua |P(u«) D (ut) | P (uw) — = 
— 1,5 0,0668 — 0,0001 0,0668 
—1,25 | 0,1056 0,0277 —0,1611 
— 1,09 | 0,1379 0,0621 0,004 
—0,79 | 0,2148 0,0519 0,0148 
—0,72 | 0,2358 0,0976 — 0,0309 
—0,49 | 0,3121 0,0879 — 0,0212 
—0,14 | 0,4443 0,0224 0,0443 
0,05 | 0,4801 0,0532 0,0134 
0,25 | 0,5987 0,001 0,0654 
0,45 | 0,6736 — 0,007 0,0736 
0,56 | 0,7123 0,0210 0,0456 
0,82 | 0,7939 0,006 0,0606 
1,01 | 0,8438 0,0229 0,0438 
1,25 | 0,8944 0,0389 0,0277 
1,45 | 0,9265 0,0735 — 0,007 


On lit sur les deux dernières colonnes du tableau les valeurs maximales 
dt (F,,F) = 0,0976 et d*(F,F,) = 0,0736 d'où on déduit d (F,,F) — 0,0976. 
Pour un risque œ — 0,10 on lit dans la table 5.1, pour n = 15 le seuil critique 
C = 0,304 donc on accepte l'hypothèse d'une loi parente N (1,5; 1), la distance obte- 
nue étant beaucoup plus faible que le seuil critique. 
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omportement 
asymptotique 


es moments empiriques associés à un échantillon nous renseignent 

sur la loi théorique. Par ailleurs, la taille d'un échantillon et la quan- 

tité d'information apportée par celui-ci sont bien sûr liées, de telle 
sorte que, si cette taille augmente, l'information sur la loi parente P de X 
augmente aussi, ce qui doit se traduire par une plus grande « proximité » 
entre la loi empirique P, et la loi théorique P. Cette notion intuitive de 
plus grande proximité d'un terme d'une suite aléatoire, avec un terme 
fixe, aléatoire ou non, demande à être traduite et définie de façon rigou- 
reuse. Nous allons donc étudier dans ce chapitre le comportement asymp- 
totique d'une suite de v.a. X,,.., X, quand n devient infini. Nous défini- 
rons essentiellement deux convergences stochastiques, parmi les nom- 
breuses existantes, la convergence en probabilité et la convergence en 
loi. Cependant, nous évoquerons aussi la convergence en moyenne qua- 
dratique car elle implique la convergence en probabilité et est générale- 
ment plus facile à établir que cette dernière, étant liée au comportement 
des deux premiers moments qui forment des suites non aléatoires. À ces 
deux types principaux de convergence seront associés les deux théorèmes 
fondamentaux de la statistique asymptotique, la loi des grands nombres 
et le théorème central limite, qui précisent le comportement asympto- 
tique de la moyenne empirique d'un échantillon. 


Objectif du chapitre : présenter les deux théorèmes fondamentaux de la 
statistique asymptotique, la loi des grands nombres et le théo- 
rème central limite, associés aux deux modes principaux de 
convergence, la convergence en loi et la convergence en proba- 
bilité. 

Concepts clés étudiés : inégalité de Bienaymé-Tchebychev, convergence 
en probabilité, convergence en moyenne quadratique, loi des 
grands nombres, convergence en loi, théorème central limite. 
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onvergence en probabilité 


La définition de la convergence en probabilité fait intervenir une suite numé- 
rique de probabilités dont la convergence sera souvent établie grâce à l'inégali- 
té de Bienaymé-Tchebychev qui lie une probabilité et une variance. Avant de 
donner la définition de cette convergence stochastique et d'en étudier les pro- 
priétés, nous allons donc au préalable présenter quelques inégalités qui seront 
utiles par la suite dans l'établissement de certaines de ces propriétés. 


négalité de Markov 


Si X est une v.a. positive dont l'espérance existe, l'inégalité de Markov établit 
que pour tout À > 0 : 


E(X) 


PIX >XE(X)}<— où P(KzÀ)< 


1 


On peut remarquer que sous sa première forme cette inégalité est sans inté- 
rêt pour À < 1 puisqu'alors le majorant de la probabilité est supérieur à un. Cette 
inégalité présente bien sûr essentiellement un intérêt théorique, utile pour cer- 
taines démonstrations ; sa portée pratique est limitée par sa généralité, le majo- 
rant étant indépendant de la loi, sa valeur numérique sera souvent très supérieu- 
re à la valeur exacte de la probabilité. 


- Exemple 6.1 


Pour À = 2 l'inégalité de Markov s'écrit P (X > 2E(X)) < 0,5 ; dans le 
cas particulier de la loi exponentielle £ (1) on obtient P (X >2)=e? 
= 0,135, valeur très sensiblement inférieure au majorant. 


Dans le cas d'une v.a. de signe quelconque, on adapte la seconde forme de 
l'inégalité de Markov en l'appliquant à [X|*, pour tout k tel que E|X[" existe : 
E|X| 


k 
P (IX > à) < 


On introduit alors un nombre & > 0 tel que &* — À et on en déduit pour tout 
e>0: 
EIX/' 


P(IXIZEe)< — 
€ 
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négalité de Bienaymé-Tchebychev 


On obtient l'inégalité de Bienaymé-Tchebychev en appliquant l'inégalité de 
Markov sous sa dernière forme, à la v.a. X — E(X) pour k = 2, donc pour une 
variable dont la variance existe, soit pour tout £ > O fixé : 
V(X) 

£2 


P(IX— E(X)| > €) < 


—> Remarque 


Cette inégalité relie la probabilité pour X de s'écarter de sa moyenne 
E(X), à sa variance qui est justement un indicateur de dispersion autour 
de la moyenne de la loi. En choisissant & = o(X) = /V(X), on obtient 
P {IX — E(X)| > o(X)} < 1 et cette inégalité est donc sans intérêt pour 
e < oO (X). On peut écrire cette inégalité pour la variable centrée-réduite 
en prenant cette fois £ = ao (X) avec a > 1 : 


(2 ) 1 
P —l|>al< — 
a? 


o(X) 

Dans le cas particulier de la loi N(m,o), la valeur exacte de la 
probabilité se calcule par P(IX —m| > ao) = 1 — P (|U| < a) = 
1 —[® (a) — D(—a)] = 2[1 — ® (a)] où U est une v.a. de loi N (0,1) et 
de fr. ®d. Pour a = 1,5 on obtient comme valeur 2 x 0,0668 = 0,1336 
alors que le majorant a pour valeur 4/9 = 0,444, valeur bien supérieu- 
re. Cet exemple montre à nouveau que la portée pratique d'une telle 
inégalité est faible, mais qu'elle sera très utile pour la démonstration de 
certaines propriétés, étant établie pour un très grand ensemble de lois de 
probabilité. 


Exemple 6.2 


négalité de Jensen 


Si g est une fonction réelle convexe sur un intervalle 7 de R (1e. 
g(ax+(1—a)y) <ag(x)+(1—a)g(y) pour tous x et y de 7 et tout 
a E [0,1], ou g’(x) >0 si g est deux fois dérivable) qui contient X ((2), 
ensemble des valeurs possibles pour la v.a. X, telle que E(X) et E [g (X)] exis- 
tent, alors : 


gLE (I < Elg (XI 


L'ordonnée (au sens de la fonction g) de la moyenne (au sens d'espérance) 
est plus petite que la moyenne des ordonnées. 
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Exemple 6.3 

Si on applique cette inégalité à g(t) = t? on obtient E?(X) < E bar 
résultat bien connu par ailleurs puisqu'il traduit que la variance est posi- 
tive : V(X) = E (X?) — E?(X) > 0. 


onvergence en probabilité 


Si (X,) est une suite de v.a. qui converge vers une v.a. X, cela signifie que X, 
se « rapproche » de X quand n augmente. On mesure la distance entre X, et X 
par |X, — X| qui sera d'autant plus petite que n sera grand ; mais, s'agissant de 
v.a., il faut considérer l'événement | X, — X| < £ qui sera réalisé avec une pro- 
babilité d'autant plus élevée que n sera grand. On va donc associer à la suite aléa- 
toire (X,) la suite numérique des probabilités de ces événements, qui devra 
converger vers un. Ceci conduit à la définition suivante. 


1) Définition 


On dit que la suite de v.a. (X,) converge en probabilité vers une v.a. X si, pour 
tout € > 0: 
P(IX, —X|<e)— 1 quand n — 


ou, de façon équivalente : 


P(IX,—X|>Ee)— 0 quand n — © 
On écrit : 
X, — X 
P 
Exemple 6.4 


Soit (U,) une suite de v.a. indépendantes, de même loi uniforme sur [0,1] ; 
on lui associe la suite (X,) définie pour tout entier n par 
X, = min{U,,...,U,}. Nous allons établir que : 


X,—0 quand n — 
P 


Pour cela, nous allons calculer, pour un & > O fixé, la probabilité 
P(IX,| > €) qui est égale à P(X, > €) puisque X, est une variable 
positive. Cette dernière probabilité est nulle pour & > 1, donc il suffit de 
considérer le cas & < 1. Toutes les v.a. U, étant indépendantes, de même 
loi que U avec P (U < x) = x pour 0 < x < 1, on obtient : 


P (IX; -o=rfQu =») [LP & >&)=[1- P(U <e)] 
i=1 i=1 


= (1—-es) — 0 


qui exprime bien que (X,) converge en probabilité vers 0. 
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2) Conditions suffisantes de convergence en probabilité 


Dans l'exemple 6.4 précédent, on a pu établir sans trop de difficultés la conver- 
gence de la suite (X,), à partir de la définition. Cependant, pour des lois plus 
complexes il peut être difficile d'obtenir l'expression de la probabilité permettant 
d'établir cette convergence. Nous allons maintenant fournir un moyen plus 
simple de démontrer cette convergence, à partir des deux premiers moments de 
XF: 


Propriété 
Si (X,) est une suite de v.a. telle que : 
E (X,) — a 
V (X,) = 0 
quand n — co, alors : 


X,—a 
P 


En fait, on peut énoncer un résultat plus général que celui qui s'applique à la 
convergence vers un nombre réel a en l'appliquant à la suite (Y,) définie par 
Y,=X,—X, avec (X,) qui converge vers la va. X, puisque Y, — 0 


& X,— X. Les conditions suffisantes pour la suite (X,) deviennent alors : 
P 
| E(X,-X)—0 
V(X, —X) = 0 
quand n — co, et impliquent : 
X,— X 
P 


Exemple 6.5 


Nous avons vu dans le chapitre précédent que pour tout x réel fixé on 
avait ETF, (x)] = F(x) et VIF, (x)] = F(x)[1 — F(x)]/n — 0, donc 
ces conditions suffisantes permettent d'établir la convergence ponctuelle 
de la fonction de répartition empirique vers la fonction de répartition 
théorique : 


F,@)— F@). 
P 
En réalité, on peut établir qu'il existe une constante universelle C telle 
que : 


2 


xeR 


P feupir cs) — F(x)| > «| < Ce?" 
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Cette probabilité converge donc vers 0 pour tout & > 0, mais en plus très 
rapidement puisqu'elle est majorée par le terme général d'une série 
convergente. Il y a donc convergence uniforme de la f.r empirique vers la 
fr théorique, selon un mode plus fort qu'en probabilité. On peut énoncer 
la forme affaiblie du théorème de Glivenko-Cantelli : 


sup |F,(x) — F(x)| = 0 
xeR P 

De cette convergence forte de la loi empirique vers la loi théorique décou- 
lent toutes les propriétés de convergence des moments empiriques asso- 
ciés à cette loi. 


3) Convergence en moyenne d'ordre p 


Les conditions suffisantes énoncées précédemment permettent en fait d'établir 
une convergence plus forte que la convergence en probabilité, qui est la conver- 
gence en moyenne quadratique, cas particulier de la convergence en moyenne 
d'ordre p que nous définissons pour cette raison. 


Définition 


On dit que la suite de v.a. (X,) converge en moyenne d'ordre p, avec 
0 < p < co, vers la va. X si: 


EX, —X|?—=0 quand n — co 
On écrit : 
X,— X 


Mp 


Dans le cas particulier p = 2, la convergence en moyenne d'ordre 2 s'appelle 
convergence en moyenne quadratique. En écrivant E(X, — X)° = 
V(X,—X)+E?(X, — X) qui est la somme de deux termes positifs, on 
retrouve les conditions suffisantes de convergence en probabilité comme condi- 
tions nécessaires de convergence en moyenne quadratique : 


éco 


LL | (x. — x) 0 


m.q. 


Pour toute valeur de p > 0, la convergence en moyenne d'ordre p est plus 
forte que la convergence en probabilité, au sens où : 


X,—=X—=X,—xX 
Mp P 


et donc en particulier : 
X,—X=X,-—xX 


m.q. P 
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Très souvent, on établit donc la convergence en moyenne quadratique pour 
obtenir la convergence en probabilité, car cela se ramène à l'étude de la conver- 
gence de deux suites numériques, généralement simple à effectuer. 


4) Théorème de Slutsky 
S1 f est une application réelle continue, alors : 
X1— X = f(X,) — f(X) 
: P 


Ce théorème exprime donc qu'une application continue conserve la conver- 
gence en probabilité, au sens où la limite de la suite des images est l'image de la 
limite de la suite. Ce résultat se généralise en deux dimensions sous la forme du 
théorème suivant. 


5) Théorème 


Si f est une application de R? dans R uniformément continue et si (X,) et 
(Y,) sont deux suites de va. qui convergent en probabilité respectivement 
vers les v.a. X et Y, alors : 

GG 10 GE) 


Si on applique ce théorème aux fonctions f définies respectivement par 


f(u,v)=u+u,f(u,v) =uv et fav) =, de X,—X et Y,—7Y on 
V P P 
us ; XX, e. 
déduit respectivement X, + Y, — X +Y,X,Y, — XY et Y. — 7 à condition 
que P(Y =0) = 0. à . n P 


oi des grands nombres 


Dans le chapitre précédent, nous avions vu que la moyenne empirique d'un 
échantillon d'une va. X avait même moyenne, au sens d'espérance mathéma- 
tique, m que X, mais avec une dispersion, mesurée par la variance, beaucoup 
plus faible, de valeur o?/n, c'est-à-dire que la variance de X était divisée par la 
taille de l'échantillon. Ainsi, quand n devient infini, cette variance tend vers zéro, 
assurant la convergence de la moyenne empirique vers la moyenne théorique 
E(X) = m. Ce résultat s'obtient à partir de l'inégalité de Bienaymé-Tchebychev, 
puisque pour tout & > 0 : 


P(IX,-m|>e)< nm D — > 0 


ce qui permet d'énoncer le premier théorème fondamental de la statistique 
asymptotique, c'est-à-dire quand la taille de l'échantillon devient infinie. 
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Théorème 


Si (X,) est une suite de v.a. mutuellement indépendantes qui admettent les 
mêmes moments d'ordres un et deux, c'est-à-dire avec pour tout entier n, 
E(X,) = m et V(X,) = o?, alors quand n — co : 


X,—m 
P 


Ce théorème est obtenu sous la condition que les va. X, aient mêmes 
moments d'ordres un et deux, mais pas forcément même loi, et s'appelle parfois 
loi faible des grands nombres. Il existe en effet une loi forte des grands nombres, 
relative à une convergence plus forte que nous n'étudierons pas ici (Voir com- 
pléments), qui peut s'obtenir plus logiquement sous la seule condition d'existen- 
ce du moment d'ordre un, puisqu'elle concerne seulement le moment d'ordre un, 
mais en renforçant par ailleurs les hypothèses, en supposant alors que les v.a. X, 
ont la même loi de probabilité. 


Exemple 6.6 
Théorème de Bernoulli 


On effectue n expériences successives indépendantes où on s'intéresse à 
chaque fois à la réalisation d'un certain événement A. On associe donc à 
chaque expérience i,1 <i <n, une variable de Bernoulli : 


= P 
#= Ê g=l-p 
La fréquence empirique, c'est-à-dire le pourcentage de réalisations de À 
est : n 
1 


f=-)x=X, 


i=1 


avec E(f,) = p et V(f,) = pq/n, d'où en appliquant l'inégalité de 
Bienaymé-Tchebychey, pour tout & > 0 : 


pq 
PR=PIR ER 0 
ne 
ce qui établit que pour n — © : 
he P= P(A) 


c'est-à-dire que la fréquence empirique (observée) d'un événement 
converge, en probabilité, vers la fréquence théorique ou probabilité de 
réalisation de cet événement quand le nombre d'expériences augmente 
indéfiniment. Ce résultat, connu sous le nom de théorème de Bernoulli, 
établit donc le lien entre l'expérience que l'on peut avoir des chances de 
réalisation d'un événement et la définition théorique que l'on a donnée de 
sa probabilité. Nous verrons dans le chapitre 7 suivant que la fréquence 
empirique fournit une estimation de la probabilité d'un événement. 
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onvergence en loi 


éfinition 


On dit que la suite de v.a. (X,) , de fr. F,, converge en loi vers une v.a. X de 
fr. F si la suite {F, (x)} converge vers F (x) en tout point x où F est conti- 
nue ; on écrit alors : 


X,— X 


loi 


Les va. X, ont toutes des lois différentes, de fr. notées F,, à ne pas 
confondre avec la f.r. empirique associée à un échantillon de v.a. qui ont toutes 
la même loi, donc la même fr. 


ien avec la convergence en probabilité 


Le lien entre les deux convergences que nous venons de définir est précisé par 
le résultat suivant. 


Théorème 


La convergence en probabilité d'une suite (X,) implique sa convergence 
en loi : 


XX > XX 
P oi 


Ce résultat se conçoit intuitivement car F,(x) représente la probabilité, 
associée à la loi de X,, de l'événement {X, < x}, et elle va converger vers la 
probabilité correspondante associée à la loi de X. La réciproque de ce résultat est 
fausse en général, mais est vraie dans le cas particulier où la limite est une v.a. 
certaine X = a, c'est-à-dire quand la loi limite est une loi de Dirac, loi dégéné- 
rée concentrée en un seul point. 


ropriété 


Si (X,) et (Y,) sont deux suites de v.a. telles que pour n — 0 : 


X,—X et YŸ,—a 
loi P 


Comportement asymptotique e 177 


où a est un nombre réel, alors : 


héorème de Slutsky 


Si g est une application réelle continue, alors : 


> s. X = g(X,) => g(X) 


onditions suffisantes de convergence en loi 


Dans le cas d'une loi discrète ou d'une loi absolument continue, on peut énoncer 
des conditions suffisantes de convergence en loi relatives aux probabilités indi- 
viduelles ou à la densité qui définissent ces lois. 


Dans le cas discret où X, (2) = X (Q) = {a;/iel}: 
Viel,P(X, = a) — PX=a)— XX, n — 0 
Dans le cas où X, et X admettent pour densités respectives f, et f : 


VXxER fQ) > FR = XX, n — 0 


héorème central limite 


La loi des grands nombres énonce la convergence de la suite X, des moyennes 
empiriques vers la moyenne théorique m, c'est-à-dire une v.a. certaine ou loi de 
Dirac, loi dégénérée dont toute la masse est concentrée en un point. Si on équi- 
libre la suite des v.a. centrées et réduites (X, — m) /0, qui converge vers zéro, 
par /ñ qui tend vers l'infini, la forme indéterminée obtenue aura une limite qui 
sera celle d'une loi non dégénérée cette fois, la loi normale. C'est ce qu'énonce 
le théorème central limite, dont nous donnons ici l'une des multiples versions. 
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Théorème 


Si (X,) est une suite de v.a. indépendantes et de même loi, admettant des 
moments d'ordres un et deux notés m = E (X,) et o? = V (X,), alors : 


X,—m 


D te) 
O loi 


C'est en raison de ce théorème que la loi normale est la loi de probabilité la 
plus utilisée en statistique. En effet, beaucoup de phénomènes individuels ne 
sont pas symétriques et donc ne peuvent pas être modélisés par la loi normale. 
Mais, dans beaucoup de situations, le phénomène étudié est la résultante d'un 
grand nombre de composantes indépendantes et le théorème central limite nous 
assure alors que la loi normale est tout à fait adéquate. 


imite d'une suite image 


Nous savons qu'une application continue transporte la convergence en loi (théo- 
rème de Slutsky, $ D) ; nous allons préciser ce résultat dans le cas d'une conver- 
gence vers la loi normale, comme celle obtenue par le théorème central limite. 
Si une suite de v.a. (X,) converge vers un nombre réel fixé m, avec une suite 
numérique (a,) convenablement choisie qui tend vers l'infini avec n on peut 
obtenir la convergence en loi de la suite a, (X, — m) vers une loi normale cen- 
trée. La suite (g (X,)) sera alors centrée sur g (m) et équilibrée aussi par a, 
pour converger vers une loi normale centrée dont l'écart type sera modifié. Voici 
l'énoncé précis de cette propriété permettant de transporter un résultat de conver- 
gence en loi. 


Propriété 
S1 la suite (X,) est telle que : 


An (An — M) > N (0,0), n — 0 


avec a, —> © et o > 0, alors si g est une application réelle dérivable, la 
suite (g (X,)) converge aussi en loi avec : 


An [g(Xh) — g(mn)] mo (0,0 |g'(m)}), n — 0 
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onvergence des moments empiriques 


1) Moyenne empirique 


Les deux théorèmes fondamentaux de la statistique asymptotique établissent la 
convergence en probabilité et en loi de la moyenne empirique. 


2) Variance empirique 


Au chapitre précédent, nous avons obtenu comme expression de la variance 
empirique : 


=; >u- (X, _ m) 


en ayant posé U;, = (X; —m). De la loi des grands nombres on déduit 
U,— E(U) = 0° et (X, — m) — 0 et par conséquent : 
P P 


S?—0o?, n— 0 
D 
On obtient bien sûr le même résultat pour $? = nS°?/(n — 1) puisque 


n/(n—1) — 1. 


En appliquant la loi des grands nombres et le théorème central limite on 
obtient : 


X,—-m—0 et Va(X, —m)= N (0,0) 
P oi 
ce qui implique d'après la propriété $ II, C que /n (X, = m) 0. Ainsi, 


Vn (5? — o?) a même loi limite que /n (U, — o?), qui est obtenue par le théo- 
rème central limite avec E(U) = o? = y et V(U) = ju — pi : 


Vn (5? _— o?) _ N (0, V7 = à) 0 
On a le même résultat pour S?. 


3) Moments empiriques 


Par application de la loi des grands nombres : 


L1s k k\ — 
Re DE ECO 
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On obtient par ailleurs V (X À] = mx — m? donc par application du théorè- 
me central limite à la suite (X{) : 


PS eee N (0,1) 


2 je 
Moy EE ms loi 


onvergence des lois usuelles 


1) Loi binômiale 


Soit X une v.a. de loi B(n,p) et supposons que 7 — co. Nous allons considé- 
rer deux cas suivant que le second paramètre p reste fixe ou tend vers OÜ avec 
1/n. 


a) Sip — 0 quand ñn — ©, avec np — À fini, alors en utilisant la formule de 
Stirling n!=n"e "V/2rn(l+e,), on montre que pour tout entier k fixé, 
O<k<n: 

k 


PX=D= (Ep Gp + ee 
ce qui, d'après la condition suffisante (cf. $ E) de convergence en loi, établit que 
la loi binômiale B (n,p) converge vers la loi de Poisson P (À). C'est pourquoi 
on appelle parfois la loi de Poisson loi des événements rares, puisqu'elle corres- 
pond à des événements de probabilité très faible, mais que l'on observe quand 
même en raison d'un très grand nombre d'épreuves, comme par exemple le 
nombre d'erreurs dans un livre ou le nombre d'accidents à un carrefour. On 
considère que l'approximation est valable pour n > 30 et np <5. 


Exemple 6.7 

Pour p =0,1 et n = 30 on lit dans la table 3 de la loi binômiale 
P(X =1)=0,1413. Si on utilise la variable Y de loi de Poisson de 
paramètre np = 3 on lit P(Y =1)—0,1494 dans la table 4, donc 
valeur très proche. 


b) Si p reste fixe quand n — co, on utilise l'approximation normale en écrivant 
la loi binômiale comme somme de va. X; indépendantes et de même loi de 


Bernoulli de paramètre p : X = 6 Comme E(X;) = p et V(X;) = pq on 


i=1 
déduit du théorème central limite : 


X,—p 
nn + N (0,1) 
/pq loi 
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Avec X, = X/n, ceci peut encore s'écrire : 


X/n — X/n— X — 
VPq Vnpq Vnpq loi 


On peut donc approximer la loi binômiale B(n,p) par la loi normale 
N (np, np). On considère que l'approximation est valable pour n > 30, 
np >5 etng >S. 


Exemple 6.8 

On lance 400 fois une pièce de monnaie et on veut calculer la probabilité 
que la fréquence d'apparition de pile soit comprise entre 0,45 et 0,55. 
On associe à chaque lancer i,1 <i <n, la va. de Bernoulli : 

1  pile(1/2) 


un É face(1/2) 


400 
La variable S=Y x; suit une loi binômiale B(400,1/2) avec 


i= 


=1 
E(S) = 200, V(S) = 100 et o(S) — 10. La probabilité demandée s'écrit : 


S 
P (045 LE 0,55) = P (180 < S < 220) 


00 
20 S—200 20 
= P < < 
10 10 10 


et peut être approximée à l'aide de la fr ® de la loi N(0,1) par 
D(2)—D(—-2)—=2dD(2) —-1—0,9544 Pour n—=900 on obtient 
E(S) = 450,V(S) = 225 et o(S) = 15 et la probabilité demandée 
devient : 


P (0,45 < — 
( 900 


< 0,55) = P (405 < S < 495) 


45 S—450 45 
=P < < 
15 15 15 


qui est approximée cette fois par 2®(3) — 1 = 0,9973. 


2) Loi hypergéométrique 
Si X suit une loi hypergéométrique de paramètres N,n et N, avec N — © et 


N,/N = p qui reste fixe, on obtient par la formule de Stirling, pour tout k fixé 
telque0<k<n: 
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P(X=H) = ren 


Il y a donc convergence de cette loi hypergéométrique vers la loi binômiale 
B(n,p). L'approximation est considérée comme justifiée lorsque le rapport 
n/N, appelé parfois taux de sondage, est inférieur à 10 %. 


3) Loi de Poisson 
Si X suit une loi de Poisson dont le paramètre À tend vers l'infini, alors : 


X —À 

Era ne N (0,1) 

Exemple 6.9 

Pour À = 16 on lit dans la table de la loi de Poisson P (X <21) 

nt < :) par ® (1,25) 
V16 4 


= 0,8944, où ® est la fr. de la loi N (0,1), soit une assez bonne approxi- 
mation malgré une valeur faible de À. 


= 0,9107. On approxime P (X < 21) = P ( 


e Correction de continuité 


Nous avons ici un second exemple d'une loi discrète qui est approximée par une 
loi continue. Si X est une variable à valeurs entières dont la loi est approximée 
par celle de la variable continue U, on ne peut pas approximer p; = P (X = Kk) 
par P(U = k) = 0! On remplace donc cette probabilité par la valeur approchée 
P(k—1/2<U <k+1/2) quiestla probabilité de l'intervalle de longueur un 


qui contient l'entier k. Aïnsi, P (X < k) = > P(X = j) va être approximé par : 
j=0 
P(U <k+1/2)= P(U—-1/2<k) 
L'approximation de la loi discrète de X par celle continue de U impose donc de 
remplacer X par U — 1/2 dans les événements exprimés à partir de X, ce qu'on 
appelle faire la correction de continuité. Dans l'exemple 6.9 précédent, 
P(X <21) doit donc être approximé par P(U —1/2 <21) = dD(5,5/4) 
= 0,9154 soit une meilleure approximation que sans la correction de continuité. 


4) Loi gamma 


Si X suit une loi y (p) avec p — ©, alors : 
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5) Loi du khi-deux 


Si X suit une loi du khi-deux dont le nombre de degrés de liberté v — © , alors : 


LES 1) 
/2v loi É 


Cependant, pour les petites valeurs de v, on obtient une meilleure approxi- 
mation en utilisant comme résultat la convergence : 


V2X — V2v — 1 N (0,1) 


Exemple 6.10 


Le fractile d'ordre 0,1 de la loi du khi-deux à 50 degrés de liberté a pour 
valeur u = 37,7 (cf. table S ). Avec la première approximation, on écrit : 


oi (SE —) 
, = ER 
V2v V2v 


Le fractile d'ordre 0,1 de la loi N (0,1) a pour valeur f = —1,2816 d'où 
on déduit comme valeur approchée de u : 10 f + v = 50 — 12,8 = 37,2. 
Pour utiliser la seconde approximation, on écrit : 


0,1= P(V2X — V2v —1 < Vu — V2v—1) 


et on obtient cette fois V2u — V2v —-1T f soit u © 37,6 valeur plus 
proche de la valeur exacte. 


6) Loi de Student 


Si X suit une loi de Student dont le nombre de degrés de liberté n devient infini, 
alors : 


X= N (0,1) 


Exemple 6.11 


Pour se faire une idée de l'approximation du fractile d'ordre 0,95 par 
celui de la loi normale qui vaut 1,645 le tableau ci-après donne les frac- 
tiles exacts de la loi de Student en fonction de n. 


n 30 40 100 | 200 500 
1,697 | 1,684 | 1,660 | 1,653 | 1,648 


184 © STATISTIQUE ET PROBABILITÉS 


© Dunod. Toute reproduction non autorisée est un délit. 


À retenir 


Il est bien sûr essentiel de retenir les énoncés des deux théorèmes fon- 
damentaux de la statistique asymptotique : la loi des grands nombres et 
le théorème central limite. Ceci suppose au préalable de bien connaître 
également les définitions des deux convergences principales associées à 
ces théorèmes : la convergence en probabilité et la convergence en loi. 

La convergence en probabilité est plus forte que la convergence en loi 
et se démontre généralement à partir des conditions suffisantes qui font 
intervenir l'espérance et la variance des termes de la suite. Ces conditions 
définissent en fait la convergence en moyenne quadratique, qui à son tour 
implique la convergence en probabilité. 


L'inégalité de Bienaymé-Tchebychev est parfois utile pour établir 
certains résultats théoriques. 


Compléments 


Nous allons présenter deux autres modes stochastiques de convergence, plus forts que la 
convergence en probabilité, et nous énoncerons notamment la loi forte des grands 
nombres. 


onvergence presque sûre 


On dit que la suite (X,) converge presque sûrement vers la v.a. X si : 
P Lo e Q/lim X, (@) = X (&)]} = 
n 


et on écrit : 


XX, n— oo 
PS. 


Cette terminologie, qui peut paraître un peu étrange, traduit le fait que la suite numé- 
rique X, (&) converge presque partout vers X (w), au sens où elle converge pour tout 
& de @ , à l'exception d'un sous-ensemble de 2 dont la probabilité est égale à zéro. Les 
quatre propriétés suivantes, qui sont équivalentes, peuvent permettre de mieux com- 
prendre le sens de cette convergence : 
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ps. 
Ÿ 
Ve > O0, lim P fsunix, — X| > e| = 0 
Ÿ 
Ve>0, limP U (LXn — X|> 2e) =0 
mn 
Ÿ 


Ve>0, limP{f(Xn-X|<e)}=1 


m>n 


Il est facile de voir que les événements suivants sont équivalents : 


UJ (Xn — XI > €) — Ésup 1x, — x el 


m>n m>n 


et ont comme complémentaire : 
(AUX — XI < €) 
m>n 


ce qui montre l'équivalence des trois conditions. La dernière condition exprime que, à 
partir d'un certain rang N = N (£), tous les événements ([X, — X| < £) pour n > N 
sont réalisés avec une probabilité qui tend vers un. La première condition signifie que : 


Sup IX» — X|—0, n — 00 


m>n P 


et implique en particulier que |X, — X|— 0, donc la convergence presque sûre est plus 


forte que la convergence en probabilité : 


XX = X,—xX 


PS. P 


à titre d'illustration de cette convergence, nous pouvons énoncer le théorème suivant. 


Théorème (loi forte des grands nombres) 


Si (X,) est une suite de v.a. indépendantes et de même loi, admettant une espé- 
rance notée m, alors : 
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onvergence presque complète 


La convergence précédente peut être difficile à établir ; cependant, si on applique 
l'inégalité de Boole, on observe que : 


PfUux.-x12 0) < Ÿ_P{IXn — X| > €} 


et donc la convergence presque sûre sera obtenue si la série de terme général 
P{IX, — X| > €} est convergente, car le majorant est le reste de cette série. Cette 
condition suffisante de convergence p.s., plus facile à établir que les conditions équiva- 
lentes de la définition, sert de définition à une convergence plus forte. 


On dit que la suite (X,) converge presque complétement sûrement vers la v.a. X si : 


(ee) 
Ve>0, Ÿ PIX, —X| > €} < +00 
n=1 
et on écrit : 
X, —> X, n— 


P.co. 


À titre d'illustration de cette convergence, nous pouvons énoncer le théorème suivant, 
énoncé sous sa forme faible dans l'exemple 6.5. 


Théorème de Glivenko-Cantelli 


Si F, est la fr. empirique associée à un échantillon d’une loi de fr. F, alors : 


sup|Æ, (x) — F(x)| — 0, n — 
p-Co. 


xeR 


Exemple 6.12 


Considérons la suite (X,) définie à partir d'une v.a. U de loi uniforme sur [0,1] 
par : 


1 

Xh = VRAUUR n>l 

n— n > Z 
O sinon 


et étudions sa convergence vers zéro. Pour tout & > 0 fixé, l'événement 


1 
(IXml > €) est équivalent à l'événement U € [AI donc : 
m 


BR USE CE) 


et par conséquent : 


& 1 1 
P [Üua. > o] = P (u É jo.) =-—0 
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ce qui traduit le fait que : 


1 1 
Cependant, P (|X,| > e) = P (u < :) — — est le terme général d'une série 
n n 


divergente et donc il n'y a pas convergence presque complète de (X,) vers zéro. 
Cet exemple montre bien que ces deux convergences ne sont pas équivalentes, 
même si dans beaucoup de cas la convergence p.s. se démontre à partir de la 
convergence p.co. 
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Exercices 


noncés 


Exercice n°1 


Étudier la convergence en probabilité, en moyenne, puis en moyenne quadratique de la 
suite de v.a. (X,) dont la loi de probabilité est définie pour n € N* par: 


1 
n2 


1 
Pepe Poeme Peel 
2n? 


Exercice n°2 


Soit (X,) une suite de v.a. dont la loi est définie pour n € N* par: 
1 1 

P(Xhy=0)=1-- et P(X,;, =n) = - 

n n 


1) Montrer que (X,) converge en probabilité, mais pas en moyenne quadratique, vers 
zéro quand n tend vers l'infini. 


2) Soit (Y,) une suite de v.a. de même loi N (0,1) et indépendantes des va. (X,). 
Étudier la convergence en loi de Z, = X, + Y, et la limite de V(Z,) quand n tend vers 
l'infini. 


Exercice n°3 


Peut-on appliquer la loi des grands nombres à la suite (X,) de v.a. mutuellement indé- 
pendantes dont la loi de probabilité est définie pour n € N* par: 


PAK == P(X = VM) = 5° 


Exercice n°4 


Étudier la convergence en loi de la suite de v.a. certaines X, = n. 


Exercice n°5 


Soit (U,) des va. indépendantes et de même loi définie par P (U, = 1) = p et 
P(U, = —1) = g = 1 — p avecO < p < 1. Déterminer la loi exacte, puis la loi limi- 
te, de la suite (V,) définie par : 
m=[IIu 
i=l 


Exercice n°6 


Soit (X,) une suite de va. de loi géométrique de paramètre p, = —, où @ est un 
X n 

nombre strictement positif. Montrer que la suite —" converge vers la loi exponentielle de 
n 


paramètre à. 
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Exercice n°7 


Soit (X,) une suite de va. de loi uniforme discrète sur l'ensemble X, (Q2) — 


1 n—]1 
Lo iuhes ,1}. Montrer que cette suite converge vers la loi uniforme sur [0,1]. 
n n 


Exercice n°8 


Soit (X,) une suite de v. a. dont la loi est définie pour n € N* par : 


1 1 1 
P(a=i-;)=r(x=1+)-; 
n n 2 


Étudier sa convergence en loi. 


Exercice n°9 


Calculer le fractile d'ordre 0,95 de la loi x, en utilisant l'approximation de la loi de 
2x2 — V2v — 1 par la loi normale standard, avec ici v = 40. 


Exercice n°10 


—nXx 


Soit X, une v.a. positive de densité f, (x) = ne "* pour x > 0. Montrer que la suite (X,) 


converge en moyenne quadratique vers zéro. 


Exercice n°11 


Soit (X,) une suite de v.a. indépendantes et de même loi, de densité f définie par : 


—(x—0) . 
e six > 0 
f GX) = : 
0 six < 0 
où 0 est un nombre positif fixé. Montrer que m, = min{X1,...,X,} converge en moyen- 


ne quadratique vers 6. Etudier la convergence en loi de Y, = n(m, — 0). 


Exercice n°12 


Soit (X,) une suite de v. a. indépendantes et de même loi normale centrée et de 
variance 0°. Étudier la convergence en loi des v. a. : 


1. 1: 
De 22 et 


Exercice n°13 
Soit (X,) une suite de v.a. mutuellement indépendantes et de même loi de Gumbel de 
densité f (x) = exp (x — e*). Déterminer la loi de probabilité de la variable aléatoire 


Zn = er, puis étudier la convergence en loi de la suite (Y,), avec 


1 À 
Y, = fr Xe) 


1 


orrigés 
Exercice n°1 


1 
Pour tout € > 0, on obtient P(|X,| < e) = P(X, = 0) = 1 — D 1 quand 
n 


1 
n — ©, donc par définition X, — 0. D'autre part, E (|X,|) = — — 0 ce qui ex- 
P n 
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prime que X, converge en moyenne (d'ordre 1) vers zéro, ce qui implique d'ailleurs sa 
convergence en probabilité. Enfin, E (xX2) — 1 donc X, ne converge pas en moyenne 
quadratique vers zéro. 


Exercice n°2 
1 
1) Pourtoute > 0, P(IX,| >) = P(X, = n) = — — 0 quand n — ©, donc par 
définition de la convergence en probabilité : # 
Xh — 0 
P 


Par ailleurs, E (X£) = n*-l donc E(X,)=1 et E (X$) — 00 pour tout entier 
k > 1. En particulier E (x?) — © et donc (X,) ne converge pas en moyenne qua- 
dratique vers zéro. Aucun moment de X, ne converge d'ailleurs vers le moment corres- 
pondant de sa limite qui est toujours égal à 0. 


2) Toutes les variables Y, ont la même loi N (0,1) qu'une certaine variable Y, donc en 
appliquant la propriété présentée $ II, C on en déduit que la suite (X, + Y,) converge 
en loi vers Y. Cependant, V(Z,) = V(X,)+V(Y)=n—-1+1=n— 0, alors 
que Z, converge en loi vers la loi normale de variance 1. 

Exercice n°3 


On ne peut pas appliquer la loi forte des grands nombres aux variables X, car elles n'ont 
pas la même loi. D'autre part, on obtient E (X,) = 0 et V (X,) = n donc on ne peut 
pas non plus appliquer la loi faible des grands nombres car ces variables n'ont pas la 
même variance. 

Exercice n°4 

Les variables X, ont pour f.r. : 

0 six<n 

1 sin <x 


F6 = | 


La suite F, (x) converge pour tout x réel vers F (x) = 0 ; cependant il n'y a pas conver- 
gence en loi car F n'est pas une fonction de répartition. 


Exercice n°5 


La va. V, étant le produit de termes qui valent 1 ou — 1 ne prend aussi que les valeurs 
1 et —1. Si nous posons p, = P (V, = 1) on obtient E (V,) = py — (1 — pr) 
= 2py — 1. D'autre part, les v.a. U, étant indépendantes : 


E(V)=[[EUW)=[[Cr-0=eCp-0" 
i=1 i=1 


1 
et par conséquent Py = 5 [1 + (2p — 1} Puisque 0 < p <1, on a aussi 


2p — 1| < 1 doncp, — 5 quand ñ — co. Ainsi la suite (V,) converge en loi vers la 


1 
v.a. V dont la loi est définie par P (V = 1) = P(V = —1) = 5; 


Exercice n°6 


X 
La fonction de répartition de Y, = —" est définie pour tout x > 0 par: 
n 
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[nx] 


Fi Q) = Ps <x)= P(X, < nx) = Pr ( — pr) = LL Le 
k=1 


sinx & N, avec dans ce cas nx = [nx] + æ& où 0 < & < 1 ; on a alors: 


one 
nfi—F,(x)] =[nx]In{1--})=(nx - a) + > —0x 
n n 


Sinx € N, alors : 
nx—] 


FO=PMEN=PE ea =d Den) el) 
k=1 


et: 


0 0 € 
Ill ,GI= Gas — Din (1 À) = Qu D RS ) > —0x 


n 
Ainsi, dans tous les cas, pour x > 0 et quand n — © : 
F, (x) — 1—e x 


la limite est la fonction de répartition sur R} de la loi exponentielle de paramètre 0, qui 
est donc la loi limite de Y,. 


Exercice n°7 


La fonction de répartition de X, est définie par : 


0 six < 0 


k .k—1 k 
Fh (x) = si <x<—, 1<k<n 
n +1 n n 
1 si 1 < x 


Pour x < 0 ou x > 1 ona F, (x) = F (x) où F est la fonction de répartition de la loi 
uniforme sur [0,1]. Examinons maintenant le cas où x € ]0,1] et soit k l'entier tel que 
k—1 


n 


< x < —. La fonction F étant strictement croissante : 
n 


F < F(x) <F{-—\}) soit 
n n 


On obtient ainsi : 


1 
< FX) < 


k k k k—1 
== <FG)-FG@ <—- 
n+1 n n+l n 


ie k n+1—k 
D CE NC 
n(n+1) n(n +1) 


Donc, pour 1 <k<n : 


n 
Ro To 


ce qui établit que F, (x) — F (x) — O0 quand ñn — © et donc que X, converge vers 
la loi uniforme sur [0,1]. 
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Exercice n°8 


Pour toute > O il existe un entier N = N(e) tel que pour n > Non ait 1/n < & et alors: 


1 1 
P(IX;,—1|<e)=-+-=1 
(| | <&) UE 
Donc P (IX, — 1| <e) —> 1 quandn —> © ce qui montre que la suite (X,) converge 
en probabilité vers la v. a. certaine X = 1, et donc aussi en loi puisque la limite est une 
constante. 


Cependant, P(X, = 1) =0 pour tout entier ñn et donc P(X, = 1) —> 0 quand 
n —> © alors que P(X = 1) = 1. Il faut donc faire attention à l’utilisation des condi- 
tions suffisantes de convergence en loi vues au $ ILE. 


Exercice n°9 


La lecture de la table 5 nous donne la valeur exacte du fractile d'ordre 0,95 de la loi x ; 
soit x = 55,76. Cependant, beaucoup de tables de fractiles de la loi du x2 s'arrêtent à 
v = 30 et donc, pour un nombre plus élevé de degrés de liberté, il faut alors utiliser l'ap- 
proximation proposée dans ces tables, soit : 


P(X < x) = 0,95 = P(V2X — V2v — 1 < V2x - V2v—1) 


= P(V2x — V2v — 1) 


où ® est la fr. de la loi N(0,1). Par lecture de la table 2 des fractiles on obtient 
V2x — V2v — 1 1,6449, soit avec ici v = 40 : x © 55,47, valeur assez proche de 
la valeur exacte. 

Exercice n°10 


Pour montrer que (X,) converge en moyenne quadratique vers zéro, il faut étudier la 
limite de : 


+00 138 
PE 
0 


ex +00 2 +00 : 2 
sl; % e dx = + 0 
n 0 n Jo n 


ce qui exprime par définition que : 
Xh — 0 


m.q. 
Exercice n°11 


Il faut d'abord déterminer la loi de probabilité de m, : 
P (mr > x) = 21 =») =[[P@>x=01-FG7r 
i=l i=1 


où F est la f.r. commune des variables X; ; ainsi, m, admet pour f.r. : 
Grxm=l-1-F@r 


et pour densité : 
8 @)=nt- EG f (@) = ne" 
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pour x > 0. On calcule alors : 


+00 1 +00 
E (m, — 0) = Î (x — 0) ne" ax = = | y'e dy 
0 n° Jo 
Fr (3) 2) 
= 7 = 2 0 
et par conséquent on en conclut que pour ñ — © : 
Mn — 0 
m.q. 
La fr. de Y, est définie par : 
HO) = P(Y <3)= P(m, —0 < =) = Gi(+ ©) 


et sa densité est donc : 
l ; 
hh (y) = — gn (0 Lo =) = € 
n n 
pour y > O, c'est-à-dire que Ÿ, suit la loi exponentielle de paramètre 1, indépendante de 
n, et qui est donc aussi la loi limite de Y,. 
Exercice n°12 


Dans les deux cas, il s’agit d’une moyenne de v. a. qui vérifie les hypothèses du théorè- 
me central limite. Il nous suffit donc de calculer les deux premiers moments de ces v. a. 
On a d’abord : 


1 +00 2 +00 2 
E(IX1) = f Ixle "2% dx = 06] — j: e “du = ©] — 
OV27 J-x IT Jo TT 


Et ensuite : 


V(IXD = E (X°) — E°(XD) = (: cu 2) 0° 


L'application du théorème central limite permet donc d’obtenir : 


On a ensuite E(X?) = 6? et comme X?/o? suit une loi x? on a aussi V(X?) = 20*. 
Ainsi : 

S2 — o? 
n — ——— N(0,1) 
va o242 loi 


Exercice n°13 


On vérifie d'abord que les v.a. Z, = e*’ suivent une loi y (1). Nous appliquons ensui- 
te le théorème central-limite à ces variables dont espérance et variance valent 1 : 


Va (Zn 1) N (0,1) 


La suite étudiée est définie par Ÿ, = —InZ, et on utilise alors la propriété II-G avec 
An = V/n et g (f) = —Inf qui nous permet d'obtenir : 


Va N (0,1) 
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stimation 


ans les chapitres précédents, nous avions un modèle probabiliste 

bien précis où la loi P de la v.a. X considérée était bien spécifiée. 

Dans la réalité, nous disposons d'observations d'un modèle 
inconnu et le travail du statisticien va consister à mettre en correspon- 
dance ces observations avec un modèle probabiliste. Le problème qui va 
se poser au statisticien peut s'énoncer de la façon suivante : disposant 
d'observations x:,...,x, d'une certaine v.a. X associée au phénomène 
étudié, obtenues à partir d'expériences aléatoires identiques et indépen- 
dantes, quelle loi théorique P inconnue peut-on retenir comme loi 
parente, c'est-à-dire, quelle est la loi de probabilité associée à ce phéno- 
mène de production des données ? Ce qu'on peut symboliser sous la 
forme suivante : 


(x1,...,xn) —> P? 


Si ce choix devait être fait parmi l'ensemble P de toutes les lois de pro- 
babilité existantes, on conçoit bien que le problème serait difficile à 
résoudre et qu'il faudrait un très grand nombre n d'observations pour y 
parvenir ; le problème serait alors qualifié de non paramétrique. Compte 
tenu d'informations a priori dont il dispose, le statisticien va restreindre 
son choix à une famille donnée (P,; 0 € @) indexée donc par 8 parcour- 
rant un ensemble @ bien déterminé. On suppose donc ici que la loi de 
probabilité est parfaitement déterminée par la donnée d'un ou plusieurs 
nombres (®@ C R ou @ C R') représenté(s) par 8 que nous appellerons 
paramètre de la distribution, ®@ étant l'ensemble des valeurs possibles du 
paramètre. Si pour deux valeurs distinctes du paramètre il pouvait y avoir 
coïncidence des lois de probabilité associées, les observations issues de 
cette distribution ne permettraient pas de distinguer ces deux valeurs du 
paramètre. Nous ferons donc l'hypothèse que pour 8 0’ on a P; £ Py, 
i.e. que l'application 9 + P, est injective, ce que nous traduirons en 
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disant que le modèle est identifiable. D'où le modèle statistique para- 
métrique (E,B,(P5; 0 € O)), où E = X (Q) est l'ensemble des valeurs 
possibles pour la v.a. X, ou espace des résultats (E C Rou R’), et B la 
tribu borélienne associée (famille des intervalles et des unions d'inter- 
valles dans R). Le problème initial du statisticien peut alors se reformu- 
ler sous la forme symbolique suivante : 


(x1,...,Xn) — 07? 


et se nomme alors un problème d'estimation. Choisir une seule valeur du 
paramètre @ est un problème d'estimation ponctuelle, choisir un sous- 
ensemble de @, dénommé région de confiance, est un problème d'esti- 
mation ensembliste, d'estimation par intervalle dans le cas particulier, 
assez fréquent, ou cette région est un intervalle de R. Ce type de pro- 
blèmes sera résolu par la donnée d'une application T : E" — F qui asso- 
ciera une (ou plusieurs) variable(s) aléatoire(s) à valeur(s) numérique(s) 
(F CRouR‘) à un n-échantillon (X:...,X,), application que nous 
nommerons une statistique. Il s'agit du modèle d'échantillonnage noté 
(E,B,(P5; 0 e O))°”". 


Objectif du chapitre : montrer comment on peut, à partir d’observations 
indépendantes d’un phénomène considéré comme aléatoire, attri- 
buer une valeur, ou un ensemble de valeurs, à un (ou plusieurs) 
paramètres qui caractérise(nt) la loi retenue pour le modèle. 

Concepts clés étudiés : estimateur, biais, estimateur convergent, erreur 
quadratique moyenne, vraisemblance, efficacité, information 
de Fisher, méthode du maximum de vraisemblance, méthode 
des moments. 


éfinition d'un estimateur 


Nous allons introduire la notion d’estimateur à partir d’un exemple familier issu 
des sondages qui, régulièrement, cherchent à connaître l’état de l’opinion 
publique vis-à-vis du président de la République. Le modèle statistique que l’on 
peut construire consiste à retenir comme ensemble 2 l’ensemble des électeurs 
français et à considérer le sous-ensemble À de ceux qui sont favorables au prési- 
dent de la République. La v.a. X associée sera alors la variable indicatrice de À, 
définie par : 


_ fil SiweA 
+= té sinon 
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La loi de probabilité de X est donc connue, c’est la loi de Bernoulli B (1,p), 
et le paramètre qui définit complètement le modèle est ici 0 = p 
= P(X=1)= P(A). La famille de lois de probabilité est donc 
{B (1,p) ; p € [0,1]} indexée par ® = [0,1]. Pour se faire une « idée » de la 
vraie valeur de ce paramètre, on effectue un sondage en interrogeant n per- 
sonnes tirées au hasard dans @ et on associe à chacune d’elles une variable de 
Bernoulli X;,1 <i < n, de même loi que X. Sans être statisticien, si on consta- 
te que 48 % des personnes interrogées sont favorables au président de la 
République, on en déduira qu’environ un français sur deux y est favorable. En 
langage courant, on dira que l’on « estime » la valeur de p à 48 %. Cette valeur, 
calculée sur l’échantillon, est une estimation, cette fois en terme statistique, du 


: Le 1€ 
paramètre p, obtenue à partir de la fréquence empirique f, = — > X; qu’on 
appellera donc un estimateur de p. Me 


Prenons un autre exemple. Supposons qu’avant de choisir un véhicule auto- 
mobile on se fixe un critère de choix basé sur le nombre moyen N de pannes par 
an que l’on est susceptible d’avoir avec un modèle donné. Ayant la possibilité de 
faire une étude statistique chez un concessionnaire, on prélève au hasard n dos- 
siers de véhicules et on note pour chacun le nombre N;,1 < i <n, de pannes 
subies la dernière année de mise en circulation. La loi de Poisson étant adaptée 
pour modéliser le nombre de pannes, on retient ici la famille de lois 
{P (0); 0€ R,.}.Le paramètre est ici la moyenne de la loi, 1.e. 0 — E(N), donc 
on estime sa valeur par la moyenne des valeurs observées sur l’échantillon, soit : 


_ LS 
F2 


Dans ces deux exemples, on a donc construit un modèle statistique où la v.a.X 
suit une loi P, et pour se faire une idée de la valeur inconnue du paramètre 0 qui 
détermine la loi de probabilité, on utilise un échantillon de cette loi. À partir des 
valeurs observées x,,...,x, on calcule ensuite une certaine valeur numérique 
que l’on considérera comme une valeur approchée de 8 et qu’on appellera une 
estimation de 9. La règle qui permettra d’effectuer ce calcul est un estimateur, 
dont la définition précise est la suivante. 


Définition 
Un estimateur de 0 est une application 7, de E” dans F qui à un échan- 
üillon (X1,...,X,) de la loi P, associe une variable aléatoire réelle (ou plu- 


sieurs dans le cas d’un paramètre multidimensionnel) dont on peut déterminer 
la loi de probabilité. 


La loi de la v.a. 7, (X,,...,X,) dépend de celle de X , et donc de 6, et chaque 
réalisation T, (x,,...,Xx,) sera une estimation de 0. Cette définition est extré- 
mement générale et ne donne pas de méthode de construction d’un estimateur. 
Cependant, comme nous l’avons vu sur les exemples introductifs, l'expression 
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de l’estimateur découle très naturellement de l’interprétation que l’on peut très 
souvent donner du paramètre. Nous avions dans ces exemples 9 = E(X), c’est- 
à-dire la moyenne théorique de la loi, et on retient donc très logiquement comme 
estimateur du paramètre 0 la moyenne empirique ou moyenne de l’échantillon : 


ES 1 n 
TM... X) = X, = LD 


Ce n’est que dans certains cas, assez rares, où le paramètre n’admet pas d’in- 
terprétation évidente, que l’on est amené à utiliser une méthode de construction 
d’un estimateur, comme la méthode des moments, généralisant cette méthode 
intuitive, ou d’autres méthodes aux propriétés voisines, comme la méthode du 
maximum de vraisemblance et la méthode des moindres carrés. 


Un estimateur est une statistique particulière, en tant que fonction de 
l'échantillon, qui permet d’attribuer une valeur au paramètre 9 à estimer. On 
pourrait donc le définir comme une statistique à valeurs dans ®. Comme nous 
n’avons ici imposé aucune condition à l’ensemble F, nous allons définir une 
propriété que l’on pourrait qualifier de minimale pour un estimateur, c’est-à-dire 
de prendre ses valeurs dans le même ensemble que le paramètre. On dira qu’un 
estimateur est strict si T, (E") CO. 


Exemple 7.1 


Si X suit une loi de Bernoulli B(1,0), T, sera un estimateur strict si 
OT, (x:,...,x,) < 1 pour tout échantillon observé (x:1,...,x,). 


Nous allons maintenant définir les propriétés essentielles que doit vérifier un 
estimateur. 


ropriétés d'un estimateur 


Ayant fait choix d’un estimateur, on se pose la question de savoir s’il s’agit d’un 
«bon » estimateur. Il va donc falloir se donner des critères de qualité. Par 
ailleurs, il se peut que pour certains problèmes on ait le choix entre plusieurs 
estimateurs et il va donc falloir aussi définir un critère de comparaison pour 
déterminer quel est le meilleur. Enfin, on peut se poser la question de savoir s’il 
n’existerait pas un estimateur qui, pour un problème donné, ne serait pas 
meilleur que tous les autres : c’est le problème de l’optimalité. Toutes ces ques- 
tions vont trouver des réponses dans l’étude des propriétés ci-après où nous sup- 
poserons pour simplifier que 0 est un paramètre réel, c’est-à-dire que ® CR. 
Ces propriétés peuvent bien sûr s’étendre au cas d’un paramètre multidimen- 
sionnel. 
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jais d'un estimateur 


Bien entendu, pour pouvoir considérer 7, (x1,...,x,) Comme une valeur appro- 
chée de 6, il faut que les valeurs prises par la v.a. T, ne s’écartent pas trop de la 
valeur, fixe, de 0. Comme 7, est une v.a., on ne peut imposer une condition qu’à 
sa valeur moyenne, ce qui nous amène à définir le biais d’un estimateur comme 
l’écart entre sa moyenne et la vraie valeur du paramètre : 


b, (0) = Es (T;) — 6 


D'où une propriété relative au biais d’un estimateur. 


Définition 
Un estimateur 7, de 0 est dit sans biais si pour tout 0 de ® et tout entier 
positif ñ : 
Eo (Th) = 0 


Exemple 7.2 


Si le paramètre à estimer est la moyenne théorique de la loi, 
ie. 0 = E(X), l’estimateur naturel est la moyenne empirique T, = X,. 
Nous avons vu dans le chapitre 5 que E, (T,) = E (X) = 6, donc nous en 
déduisons le résultat très général que la moyenne empirique est toujours 
un estimateur sans biais de la moyenne théorique (espérance mathéma- 
tique), quelle que soit la loi de probabilité de la variable X. 


Cependant, cette propriété peut ne pas être strictement vérifiée, le biais dimi- 
nuant seulement quand la taille d’échantillon augmente. Ceci correspond à la 
définition suivante. 


Définition 
Un estimateur 7, de 0 est dit asymptotiquement sans biais si pour tout 0 
de O : 
Eo (Th) — 0 quand n — 


Exemple 7.3 


Si le paramètre à estimer est la variance théorique de la loi, i.e. 0 = V(X), 


n 
: : Fe Tr 2 
l’estimateur naturel est la variance empirique T, = S? = — ) (X i— X;) 
n 


i=1 
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— ] 
et nous avons vu dans le chapitre 5 que Eg (T,) = ———0. Donc S’? est un 
n 


estimateur asymptotiquement sans biais de 0. Nous avons vu aussi que 
n 


E» (5?) = V(X) = 6, où S? = —— ») (X; — x) est la variance empi- 
i=1 


rique modifiée qui est donc toujours un estimateur sans biais de la variance 
théorique, quelle que soit la loi de probabilité de la variable X. 


onvergence d'un estimateur 


Intuitivement, on est amené à penser que si la taille de l’échantillon augmente, 
l'information sur le paramètre 0 va augmenter et donc l’estimateur devrait d’une 
certaine manière se « rapprocher » de la valeur de 0. Cet estimateur étant une v.a., 
la formulation mathématique de cette notion intuitive va faire appel à la conver- 
gence en probabilité d’une suite de v.a. : T, prendra des valeurs proches de 0 avec 
une probabilité d’autant plus proche de un que la taille d’échantillon n sera gran- 
de. Ceci conduit à la définition suivante. 


Définition 


Un estimateur 7, est convergent si la suite de v.a. (7,) converge en proba- 
bilité vers la valeur du paramètre, c’est-à-dire pour tout 0 de © : 


T,—> 08 P,(IT,-0|<e)— 1, Ve >0, n — 0 
P 


& P,(IT, —-0| > Ee) — 0 


Il existe un moyen en général simple de vérifier cette propriété de conver- 
gence, à partir de conditions suffisantes faisant intervenir les deux premiers 
moments de l’estimateur, et que nous énonçons dans le théorème ci-après. 


Théorème 
Tout estimateur sans biais dont la variance tend vers zéro est convergent : 


E (T:) = Ô 


ie D ee 0, n— © 


Ce résultat se déduit directement de l’inégalité de Bienaymé-Tchebychev : 


Vo (Ti) 
2 


P, (IT, — 01 > €) < — 0, Ve > 0, n— 
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En fait, sous les hypothèses du théorème, on obtient une convergence 
plus forte qui est la convergence en moyenne quadratique puisqu’ici 
Vo (Ts) = Eo (Ts — 0) — 0 quand n — 00. 


Exemple 7.4 


Si 0 — E(X), ce paramètre est estimé sans biais par T, = X,, et on sait 
de plus que Vi(T,) = V(X)/n donc Vi(T,) — 0 quandn — © etT, est 
convergent (résultat que l’on aurait pu déduire directement de la loi des 
grands nombres). Ainsi, la moyenne empirique est un estimateur sans 


biais et convergent de la moyenne théorique E(X), quelle que soit la loi 
de X. 


Le résultat précédent peut être obtenu sous des conditions un peu plus géné- 
rales énoncées ci-après. 


Théorème 


Tout estimateur asymptotiquement sans biais dont la variance tend vers 
zéro est convergent : 


E;(T,) — 6 l 


WT.) — 0 > T, —— 0, n — 


P 


Là encore, ces conditions suffisantes de convergence en probabilité de T, 
établissent en fait que cette suite converge en moyenne quadratique. 


stimateur optimal 


1) Qualité d'un estimateur 


La qualité d’un estimateur va se mesurer à l’aide d’une distance au paramètre 
qui peut être par exemple |T, — 0| ou (T, — 6)°. Pour obtenir un indicateur 
numérique on peut alors déterminer la valeur moyenne de cette distance. 
L’indicateur généralement retenu, car 1l se prête facilement aux calculs, est l'erreur 
quadratique moyenne définie pour tout 0 par : 


EQ(T,) = Eo(T, — 0) = Vol) + b2(0) 


Dans le cas particulier d’un estimateur sans biais, cette erreur quadratique se 
confond avec la variance de l’estimateur. Si dans l’erreur totale d’estimation on 
privilégie l’erreur structurelle, mesurée par b2(0) , on fera choix d’un estimateur 
sans biais et l’erreur d’estimation se réduira à l’erreur statistique mesurée par la 
variance de l’estimateur. Si on se place donc dorénavant dans la classe des esti- 
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mateurs sans biais, on pourra comparer deux estimateurs T, et 7” de cette clas- 
se par leur variance qui mesure alors leur dispersion par rapport au paramètre 
qui est leur espérance commune. Nous dirons que l’estimateur 7, est plus effi- 
cace que 1” si pour tout 0 de ® et pour une taille d’échantillon n > N: 

Vo (D) < Vo (T;) 


n 


La question se pose alors de savoir si on pourrait trouver un troisième esti- 
mateur qui serait à son tour meilleur que 7, . En cas de réponse positive, il fau- 
drait poursuivre la recherche, ce qui nous conduirait à essayer d’améliorer indé- 
finiment un estimateur. Le problème n’admettrait une fin que si l’on savait que 
l’estimateur obtenu est le meilleur. Le paragraphe suivant va fournir des élé- 
ments de réponse. 


2) Inégalité de Fréchet-Darmois-Cramer-Rao 


Nous allons voir que dans certaines conditions il existe une borne inférieure 
pour l’ensemble des variances des estimateurs sans biais, ce qui va constituer un 
butoir ne permettant pas d'améliorer sans cesse les estimateurs. D'autre part, si 
cette borne est atteinte par un estimateur, il deviendra le meilleur et sera quali- 
fié d’optimal dans la classe des estimateurs sans biais. Pour énoncer ce résultat, 
nous avons besoin d’introduire la définition suivante. 


Définition 


On appelle vraisemblance (likelihood) de l'échantillon (X:,...,X,) la loi 
de probabilité de ce n-uple, notée L (x:,...,x,; 0), et définie par : 


EG 1 Nr 
=] 
si X est une v.a. discrète, et par : 
BC) ETES 00) 
œil 


si X est une v.a. continue de densité f (x; 0). 


Le théorème suivant va préciser la borne inférieure pour la variance des esti- 
mateurs sans biais, sous certaines hypothèses relatives à la loi de probabilité de 
X et que nous appellerons hypothèses de Cramer-Rao. Nous ne donnerons pas 
le détail de ces hypothèses (voir compléments) qui sont essentiellement des 
conditions techniques portant sur l’existence de dérivées de la densité f de X et 
la possibilité d’intervertir les opérations de dérivation et d’intégration. 
Cependant, nous ferons figurer dans l’énoncé du théorème la condition indis- 
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pensable pour que cette inégalité soit vraie et qui n’est pas satisfaite pour cer- 
taines lois usuelles, alors que les autres hypothèses sont généralement vérifiées. 
Enfin, cet énoncé fait intervenir la notion de quantité d’information de Fisher 


qui est définie par : 
1 © = 8, (RL - 
n 0; 30 


Théorème 


Sous les hypothèses de Cramer-Rao, en particulier si E = X ($2) est indé- 
pendant du paramètre à estimer 0, pour tout estimateur sans biais 7, de 0 


on a: 
1 


an me 0 


La quantité B- (8) est la borne inférieure de Fréchet-Darmois-Cramer-Rao 
(FDCR en abrégé). Notons que dans les conditions d’application de ce théorè- 
me, en particulier si £ = X (Q) est indépendant du paramètre à estimer 0, on 
obtient une expression équivalente de la quantité d’information de Fisher qui est 
généralement plus simple à calculer : 


9?InL 
I, (0) = E, 30. 


Exemple 7.5 


Soit X une v.a. de loi exponentielle de paramètre 1/0, ou loi y (1,1/0), 
avec 0 > 0, de densité pour x > 0 : 


1 
:0 — —e7*/8 
f (x: 0) ris 


La vraisemblance admet ici pour expression : 


Pour calculer la quantité d’information de Fisher nous écrivons la log- 
vraisemblance : 


1 n 
InL (x,...,%,5 0) = —nin — = D 


Nous dérivons par rapport au paramètre : 


oInL n 1 
He De 52% 
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Soit en élevant au carré : 


ônL\? 1! , on 7.7 
CR) af (Es)| 


i=1 


n 
Si on pose S, = > X;, on obtient : 


i=] 
LO= Lin 2r,(s)2 LE, (s 
AO LS m] e(S)+ 3 o (2) 


Avec Eo (Sn) =nEo(X) = n0,  Eo(S7) = Va(Sn) + ES) = nVa(X) 
+ n°20? = n(n+1)0? on obtient : 


n 
1,@)= > 


Comme X (Q) =R, est indépendant de 0, on peut utiliser la seconde 
expression de la quantité d’information de Fisher, calculée à partir de : 
dnL on 2 - 
DE + OR TOP 


ce qui permet d'obtenir plus facilement : 
dInL\ nn n0 nn 
00 ] : 


I (0) = Bi ( 


Exemple 7.6 


Si nous prenons maintenant l'exemple de la loi exponentielle sur 
[8,+oo!, de densité : 


Le Per) Sie 0 
OS | 0 sinon 


La vraisemblance s'écrit : 


L (x1,...,Xn; 0) = exp Se — »| 
i=1 


si tous les x; sont plus grands que 6, c’est-à-dire si min {x;/1 <i <n} > 6. 
On a alors : 


InL (x:,...,x,5 0) = D + n0 
i=1 
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On peut remarquer ici que 


9°1 d°InL 
D = 0 et par conséquent E; (- D ) = 0 


ne coïncide pas avec la valeur de la quantité d’information de Fisher, ce 
qui s'explique par le fait qu'ici X (2) = [0,+o[ dépend du paramètre à 
estimer 0. 


3) Estimateur efficace 


Le théorème précédent fournit une borne inférieure pour la variance des estima- 
teurs sans biais, qui peut ou non être atteinte. Si cette borne est effectivement 
atteinte par un estimateur, il sera donc le meilleur, selon ce critère, dans la classe 
des estimateurs sans biais. Cette optimalité se traduit par la définition suivante. 


Définition 


Un estimateur sans biais 7, est dit efficace si sa variance est égale à la 


borne inférieure de FDCR : 


Vo (T;) — 


1, (0) 


Exemple 7.7 


Si nous reprenons l’exemple de la loi exponentielle de paramètre 1/0, 
comme E; (X) = 4, on sait que T, = X, est un estimateur sans biais et 
convergent. De plus : 
_ Vy(X) 0? 1 
V. T, —= V. X, = — — 
o (Ti) = Vo (X5) =. RAC 


donc cet estimateur est aussi efficace. 


Remarque 


Un estimateur efficace est bien sûr optimal, mais dans la classe des esti- 
mateurs sans biais. Si on utilise comme critère l’erreur quadratique, qui 
est une mesure de l’erreur totale où les erreurs structurelle et statistique 
jouent le même rôle, on peut trouver un estimateur qui soit meilleur qu’un 
estimateur efficace. Par exemple, dans le cas d’un échantillon d’une loi 


N (0,0), on sait que o° = LS x est un estimateur efficace de o?, 
i=1 
avec EQ (o?) = V (0?) = 2 Mais, si on retient l’estimateur avec 
i n 
n +2 
d’erreur totale plus faible puisque E Q (T,) = - 


n 
biais T, = ) x; on obtient un estimateur meilleur, c’est-à-dire 
i=1 


4 


— < EQ (o?). 
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éthodes de construction d'un estimateur 


Dans les situations où il n’y a pas d’estimateur évident, on est amené à recourir 
à une méthode de construction d’un estimateur, les deux méthodes que nous pré- 
senterons ici étant celles du maximum de vraisemblance et des moments. 


éthode du maximum de vraisemblance 


La vraisemblance L (x1,...,x,; 0) représente la probabilité d’observer le n -uple 
(X1,...,X,) pour une valeur fixée de 9. Dans la situation inverse ici où on a 
observé (x:,...,x,) sans connaître la valeur de 6, on va attribuer à @ la valeur 
qui paraît la plus vraisemblable, compte tenu de l’observation dont on dispose, 
c’est-à-dire celle qui va lui attribuer la plus forte probabilité. On se fixe donc la 
règle suivante : à (x1,...,x,) fixé, on considère la vraisemblance L comme une 
fonction de 8 et on attribue à @ la valeur qui maximise cette fonction. D’où la 
définition suivante. 


Définition 


. On appelle estimateur du maximum de vraisemblance (emv) toute fonction 
0, de (x1,...,x,) qui vérifie : 


L ee) —= max L (x:,...,x,; 0) 


0€e® 


Cette définition ne renseigne en aucune façon, ni sur l’existence, ni sur l’uni- 
cité, d’un tel estimateur. La recherche de l’emv peut se faire directement par 
recherche du maximum de L, ou dans le cas particulier où la fonction L est deux 


OL 
fois dérivable par rapport à 4, comme solution de l’équation 50 — 0 qui vérifie 
2 


aussi 307 < 0. Cependant, la vraisemblance se calculant à partir d’un produit, 


on préfère remplacer ce dernier problème par le problème équivalent pour la 
: ; : ; . omL 
log-vraisemblance, puisque la fonction In est strictement croissante, L 


00 
9°InL : a none 
302 <O0 et qui aura une expression généralement simplifiée. 


Remarquons enfin que si 6, est un emv du paramètre 6, alors g (6,) est un emv 
du paramètre g(0) pour toute fonction g. Si par exemple la variance empirique 
modifiée Se, qui est un estimateur sans biais de 0 = V,(X), est un emv pour un 
modèle statistique donné, alors S, est un emv du paramètre 


avec 
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g (0) = 0 (X) = Vs (X) = V6. Notons cependant que S$, ne peut pas être 
aussi un estimateur sans biais car on aurait alors V, (S,) = Ey (5?) — E° (S,) 
—<0—-0—0. 


Exemple 7.8 


Cherchons l’emv pour la famille de lois exponentielles de paramètre 1/0. 
La log-vraisemblance est indéfiniment dérivable pour 0 > O et nous 
avions obtenu dans l'exemple 7.5: 


ônL on 1% 
5 — 6. 12% 


l = 
qui s’annule en changeant de signe pour 0 = — ) X; = Xh, avec : 
i=1 


d’InL n D. n nu 
902 — LE 03 >* Er ZE] (O —2x,) 
i=l 


soit pour Ô = X, : 


donc l’emv est 0, = X,. 


Exemple 7.9 


Dans le cas de la loi exponentielle sur [0,+oo[, la vraisemblance avait 
pour expression : L 
ee "n Op <min{x/1<i<n 

AC | i/ 


0 min{x;/1<i<n}<0 


Pour 0 < min{x;/1 <i <n} la vraisemblance est une fonction croissan- 
te de © et ensuite elle S’annule ; l'allure générale du graphe de L 
(cf. figure 7.1) montre bien que L est maximum pour 
0 = min{x;/1 <i <n}, ce qui correspond à l’emv : 


0, =min{X;/1<i<n} 


LÀ 


0 min x; 0 


Figure 7.1 
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—+ Remarque FR 

Dans l’exemple 7.9, nous avons InL = n0 — nX, et = n ne S’annule 
pas ; la recherche du maximum de L (ou de InL) s’est effectuée directe- 
ment, sans avoir recours aux dérivées. Rappelons à ce propos que dans la 
recherche des extremums d’une fonction réelle g, la condition g’ (xo) = 0 
n’est ni nécessaire, ni suffisante, pour qu’il existe un extremum en X%. 
Cette recherche d’extremum doit se faire directement, à partir de la condi- 
tion qui le définit, c’est-à-dire g (x) — g (x) a un signe constant au voi- 
sinage de x,. Ce n’est que dans le cas d’une fonction deux fois dérivable 
sur un intervalle ouvert, que le maximum est obtenu à partir des condi- 
tions g’ (x) = 0 et g” (xo) < 0. 


éthode des moments 


Dans le cas où le paramètre à estimer est 0 = E, (X), moyenne théorique de la 
loi, nous avons vu que l’estimateur naturel était la moyenne empirique, ou 
moyenne de l’échantillon, X,. De même, pour estimer le paramètre 9 = V, (X), 
variance de la loi, nous retenons logiquement comme estimateur la variance empi- 
rique S°?. Plus généralement, si l’un des moments d’ordre k € N*, non centré 
mr = Ep (X°) — my (0), ou centré y = Ey (X — m;)* = y (0), dépend de 6, 
nous allons chercher un estimateur par résolution de l’équation en 9 obtenue en 
égalant moment théorique et moment empirique correspondant, soit : 
1€ 1 = _. 
Min — fi Ds = My (8) OÙ Un — 7 +: (X; ne x) = Uk (8) 


i=1 


La solution de l’équation, si elle existe et est unique, sera appelée estimateur 
obtenu par la méthode des moments. Dans les exemples introductifs où 
0 = E, (X) et 0 = V,(X), les équations à résoudre s’écrivaient sous forme 
résolue 0 = X, et 0 — S?. 


Exemple 7.10 


Si X suit une loi exponentielle de paramètre 0, on sait que E, (X) = 1/0 et 
l'équation à résoudre s'écrit X, = 1/6, de solution immédiate 0 = 1/X,, 
qui correspond à l’estimateur obtenu par la méthode des moments : 
& 1 
n x. 

Bien entendu, on pourrait utiliser cette méthode avec des moments d’ordres 
plus élevés et obtenir ainsi d'autres estimateurs. En utilisant par exemple la 
variance Vy (X) = 1/0? on obtient le nouvel estimateur 0, = 1/5". 


Cette méthode intuitive se justifie par les propriétés de convergence des 
moments empiriques vers les moments théoriques correspondants (cf. chap 6, 
$ IL H). 


208 e STATISTIQUE ET PROBABILITÉS 


© Dunod. Toute reproduction non autorisée est un délit. 


stimation par intervalle de confiance 


xemple introductif 


Un industriel commande un lot de tiges métalliques qu’il ne peut utiliser que si 
leur longueur est comprise entre 23,60 mm et 23,70 mm. Ces tiges ont été fabri- 
quées par une machine qui, lorsqu'elle est réglée à la valeur m, produit des tiges 
dont la longueur peut être considérée comme une v.a. X de loi normale 
N (m,o), où l’écart type o est une caractéristique de la machine, de valeur 
connue, ici o = 0,02 mm. Compte tenu de la symétrie de la distribution nor- 
male, la proportion de tiges utilisables par l’industriel sera maximale si le régla- 
ge a été effectué à m0 — 23,65 mm. Ne connaissant pas cette valeur, à la récep- 
tion d’un lot de tiges l’industriel prélève au hasard n tiges dont il mesure les lon- 
gueurs X,,...,X, pour se faire une idée de la valeur du paramètre de réglage m. 
Il calcule la moyenne des longueurs observées et ayant obtenu la valeur 
X, = 23,63 il en conclut que, s’il est peu réaliste de croire que la valeur de m 
est exactement 23,63 mm, elle doit malgré tout être très proche de cette valeur 
moyenne observée sur l’échantillon. Il lui paraît raisonnable d’aboutir à une 
conclusion de la forme « il y a 95 chances sur 100 que la valeur de m soit com- 
prise entre 23,63 — a et 23,63 + b ». Le problème consiste alors à fixer des 
valeurs précises pour a et b et on conçoit bien qu’elles doivent dépendre des 
« chances » que l’on a attribué à cet intervalle de contenir effectivement la vraie 
valeur de m. L’intervalle ainsi obtenu s’appellera intervalle de confiance et sa 
probabilité qui a permis de le déterminer, niveau de confiance. La longueur de 
cet intervalle sera bien sûr proportionnelle à ce niveau de confiance. On peut par 
exemple toujours fournir un intervalle qui contient avec certitude le paramètre 
en le choisissant suffisamment large ; mais dans ce cas, cet intervalle ne nous 
renseigne en aucune façon sur la vraie valeur du paramètre. Il faut donc arriver 
à un compromis entre un intervalle pas trop grand et une probabilité assez éle- 
vée de contenir le paramètre. 


Pour une famille quelconque de lois de probabilité (P,; 0 € @) on peut don- 
ner la définition suivante. 


Définition 


Un intervalle de confiance pour le paramètre 0, de niveau de confiance 
1—a € ]0,1[, est un intervalle qui a la probabilité 1 — æ de contenir la vraie 
valeur du paramètre 0. 
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rincipe de construction 


Dans l’exemple précédent, nous avions abouti à un intervalle de la forme 
X, — a <m < X, + b qui correspond à la réalisation d’un événement devant se 
produire avec une probabilité fixée 1 — &. La détermination des valeurs de a et 
b va donc se faire à partir de la valeur 1 — & de la probabilité, fixée par le sta- 
tisticien, à partir de la condition qui s’écrit ici : 


1—-a=P{X,-a<m<xX,+b} 
qui est équivalente à : 
1-a=P{-b<X,-m<a). 


Il n’y a donc qu’une seule condition pour déterminer ces deux valeurs ; 
cependant, la loi de la v.a. X, — m qui sert à construire cet intervalle étant symé- 
trique, on choisit b = a et on utilise la variable centrée et réduite pour détermi- 
ner la valeur de a qui vérifie la condition : 


X,-m a 


a 
RDA TE TNT 


1l—-a—=P 


Si ® est la fr. de la loi N (0,1), alors a est solution de : 


1—a=®D(ayn/o)-b(-a/n/o) =2®(a/n/o)—1 


ou 1—@/2= D(a/n/o), soit aÿn/o = D! (1 — @/2). Pour un niveau de 
confiance de 0,95, soit & = 0,05, et pour une taille d’échantillon n = 100, le 
fractile d’ordre 0,975 de la loi N (0,1) a pour valeur 1,96 et on en déduit 
a = 0,004, d’où l'intervalle : 


23,626 < m < 23,634 


obtenu pour cet échantillon particulier. 


À partir d’un intervalle que l’on souhaitait obtenir pour le paramètre et dont 
les bornes s’exprimaient en fonction d’un estimateur de ce paramètre, on est 
arrivé à un intervalle pour l’estimateur, qui pouvait être déterminé avec précision 
puisqu’on connaissait sa loi. Ceci va nous fournir le principe de construction 
d’un intervalle de confiance en effectuant la démarche en sens contraire. 
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Le point de départ est fourni par un estimateur 7, du paramètre 6, construit à 
partir d’un échantillon (X:,...,X,) et dont on connaît la loi en fonction de 9, ce 
qui va permettre de déterminer les valeurs # = f1 (0) et ft: = ft (0) telles que : 


Pyft (0) <T, <tb(0)}=1- a 


Il faut ensuite inverser cet intervalle pour 7, , dont les bornes dépendent du para- 
mètre 0, pour obtenir un intervalle pour 9, dont les bornes vont dépendre de l’esti- 
mateur 7,, c’est-à-dire déterminer les valeurs a = a (T,) et b = b(T,) telles que : 


P,{a(T,) <0 <b(T,)}=1-« 


On peut écrire également P, {0 € [a (T,) ,b (T,)]} = 1 — « et on voit ainsi 
que [a (T,) ,b (T,)] est un intervalle de confiance de niveau 1 — & pour le para- 
mètre 0. Il s’agit d’un intervalle aléatoire, au sens où ses bornes sont des v.a., 
dont chaque échantillon fournira une réalisation. Pour obtenir cet intervalle, il 
faut donc trouver l’ensemble des valeurs de @ pour lesquelles on a simultané- 
ment, pour 7, fixé : 


n(60)<T, et T, <h(0) 
Cet ensemble sera plus ou moins facile à obtenir selon le comportement des 


fonctions f, et f,. Si par exemple ces deux fonctions sont croissantes, on voit sur 
la figure 7.2 que : 


HOT SUN OU) ét Lim eébzs 


T,, À 
t(0) 
t1(0) 
T, 
aT)=lT)  bTy=HT) Û 
Figure 7.2 
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L’intervalle est facile à obtenir ici car les fonctions f, et #, sont inversibles, 
et on obtient alors : 


H(OYST<EO) Sa(t)=5" H)<0<r (T)=b(4) 


Il existe cependant une part d’arbitraire dans le choix simultané de f; et # 
puisqu'il n’y a qu’une seule condition pour déterminer ces deux valeurs, qui 
peut d’ailleurs aussi s’écrire P, (T, < t1) + Py (T, > b) = @, le risque total « 
pouvant être a priori réparti de multiples façons. Posons 1 = P, {0 > b(T,)} 
et &; = P, {0 < a(T,)} ; les différents choix possibles sont les suivants. 


a) Intervalle bilatéral (œ,œ2 > 0) 

+ Symétrique : œ, = œ2 = «/2 

C’est le choix que l’on fait si la loi de 7, est symétrique, ou si on n’a aucune 
information particulière, ce choix étant le moins arbitraire. 

- Dissymétrique : &, £ 


Seules des raisons très particulières peuvent permettre de fixer les valeurs de &, 
et «: telles que œ: + oœ2 = «. 


b) Intervalle unilatéral (œ,œ, — 0) 
+ À droite : 1 = 0,0 = 


C’est l’interprétation donnée au paramètre 0, comme par exemple la résistance 
d’un matériau qui doit être supérieure à un seuil minimum, qui conduit à un 
intervalle de la forme 9 > a(T,). 


° À gauche : &, = &,aœ = 0 


S1 par exemple le paramètre est une proportion de défectueux dans un lot, ou un 
taux d’impuretés, on souhaite qu’il soit inférieur à un seuil maximum, d’où un 
intervalle de la forme 0 < b(T,). 


ntervalle pour une proportion 


Nous allons voir sur cet exemple que l’inversion de l’intervalle pour la statis- 
tique n’est pas toujours aisée, surtout lorsque sa loi est discrète. Supposons que 
l’on ait effectué un sondage pour déterminer les intentions de vote pour un cer- 
tain candidat à une élection présidentielle. À chaque individu interrogé, on asso- 
cie une variable de Bernoulli qui prend la valeur 1 si cet individu : déclare vou- 
loir voter en faveur de ce candidat : 


_f1 p ; 
xi= {6 als 1<i<n 
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Le paramètre p de cette loi de Bernoulli représente la proportion, dans la 
population, d’électeurs favorables à ce candidat et est estimé par la proportion 
observée dans l’échantillon : d 

De A ” X i 
L i=1 


Nous savons que, en tant que moyenne empirique estimant une moyenne 
théorique, cet estimateur naturel de p est sans biais et convergent. Nous allons 
établir maintenant que c’est aussi l’estimateur du maximum de vraisemblance et 
qu’il est efficace. Pour cela, on suppose que la taille de la population est suffi- 
samment grande pour que les variables X; puissent être considérées comme 
indépendantes, c’est-à-dire que l’on se place dans le cadre d’un schéma binô- 
mial avec remise. La vraisemblance s’écrit alors : 

n n 
ñ X; n= D. X; 
EGpaine [less ep 
i=1 


avec x; € {0,1}. On obtient donc comme expression de la log-vraisemblance : 


InL(x:,...,x,; p) = (> x} + (r — > x] — p) 


i=1 i=1 
d’où en dérivant : 
X; n — X; 
ame 27 D __(A—p})s —-(@—s:)p 
op P lp PC 2) 


n 
en ayant posé s, — ) x; ; cette dérivée s’annule pour s, — ñnp = 0, soit 
i=1 


p = s,/n, avec comme dérivée seconde : 
d?InL Su n—5, 
2 — 2 2 
op OR 
car O<s,<n; p, = S,/n est donc l’emv de p. La variable S, suit une loi 


B(n,p) et comme nous sommes dans les conditions d’application de l’inégali- 
té FDCR, nous pouvons calculer la quantité d’information de Fisher par : 


0 


rm) _ E(S,) n—E(s). nn 


1, (p)=E = 
CL ( PO Q-p}  pÜ-p) 


Comme E (p,) = p et V(p,) = p(i1—p)/n=1/1,(p), on en conclut 
que p, est efficace. 


Pour construire un intervalle de confiance pour p de niveau 0,95 il faut déter- 
miner les valeurs de f, = ft (p) et >} = t: (p) telles que P (4, < p, < 12) = 0,95. 
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Nous pouvons pour cela utiliser la loi exacte de np, = S, et retenir un intervalle 
à risques symétriques, c’est-à-dire retenir les conditions P (np, < nt) 
= P(np, > nt) = 0,025. Cependant, une première difficulté se présente 
puisque la loi est discrète et que ces égalités n’admettent pas forcément de solu- 
tion, au sens où il n’y a pas de fractiles d’ordre 0,025 ou 0,975. Nous allons donc 
construire un intervalle qui sera de niveau au moins égal à 0,95 en retenant plu- 
tôt les inégalités P (np, < nt) < 0,025 et P (np, > nt) < 0,025. On doit 
donc déterminer le plus grand entier n, tel que : 


fn nk 
> (,]P@-—p"<0,025 


k=0 
et le plus petit entier n; tel que : 


72 


n\ x n—k 
5» 4 JPA p) 2 0,975 


k=0 


Pour tout entier fixé ñn, et pour chaque valeur de p, on peut déterminer les 
solutions f, = n;/n et , =n;/n de ces inéquations et tracer ainsi point par 
point le graphe de ces deux fonctions de p. Pour chaque verticale, c’est-à-dire 
pour p fixé, ces deux courbes déterminent un intervalle [r, (p), t> (p)] tel que 
P (ti < Ph <h) > 0,95. Pour une valeur observée p, l'intersection de l’hori- 
zontale correspondante avec ces deux courbes permet de lire sur l’axe des abs- 
cisses l’intervalle des valeurs de p pour lesquelles on a simultanément 
hi (p) < Pr et D (p) > p, (cf. figure 7.3). Ainsi, l'intervalle de confiance s’ob- 
tient par simple lecture de l’abaque correspondant à un niveau de confiance 
donné. On a un couple de courbes associées à chaque valeur de n. 


A 
Pa 
il L 
bp) 
ti(p) 
Pn 
L = 
0 intervalle pour p 1 P 
Figure 7.3 
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Dans l’exemple proposé, si pour n = 100 on a observé l’estimation 
Pioo = 0,44 la lecture de l’abaque 2 (où p, = X, est en abscisse et p en ordon- 
née) conduit à l’intervalle de confiance bilatéral : 


0,341 < p < 0,538 


Si on ne dispose pas d’abaque permettant d’obtenir sans calculs l'intervalle 
exact, et si la valeur de n est suffisamment grande, on obtiendra un intervalle 
approché (i.e. de niveau voisin de 0,95) en utilisant la loi asymptotique de p,, 
déduite du théorème central limite : 


Pn — P 
WE) —— N(0,1) 
/Pq loi 


On retient alors un intervalle symétrique, à partir de la valeur de a lue dans 
la table 2 de la loi normale, telle que : 


Pa — P 
P-a< vi <al=1-a 
VPq ) 


Soit pour & = 0,05 : a = D! (0,975) = 1,96 d’où : 


p.196) < p<5,+196/2) 005 
n n 


Pour en déduire un intervalle pour p, il faudrait résoudre ces deux inéqua- 
tions du second degré en p.. Il est plus simple de faire une seconde approxima- 
tion en remplaçant p par p, dans les bornes de l'intervalle, ce qui conduit à l’in- 
tervalle de confiance pour p : 


Ph (1 ee Pa) = D (1 cu Pn) 
<p<Pr+a 
n 


où a — D (1 —«/2). On considère que cette approximation est acceptable 
pour np (1 — p) > 3. Avec les données de l’exemple on obtient l’intervalle : 


0,343 < p < 0,537 


On aurait pu également remplacer p (1 — p) par sa borne supérieure, qui 
vaut 1/4, et obtenir ainsi l’intervalle approché le plus grand : 


Le a 
Ps n 
Dans cet exemple on obtient : 


0,342 < p < 0,538 


Sp Di 


a 
2/n 


intervalle qui est donc bien un peu plus grand que le précédent ; seul le premier 
intervalle est exact, mais les approximations utilisées ici avec n = 100 donnent 
des résultats très voisins. 
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ntervalles associés aux paramètres de la loi normale 


On dispose d’un échantillon (X:,...,X,) d’une v.a. X qui suit une loi N (m,0o) 
pour construire un intervalle de confiance relatif à l’un des deux paramètres de 
cette loi, l’autre paramètre étant connu ou inconnu. Ceci correspond aux diffé- 
rentes situations que nous allons étudier maintenant. 


1) Intervalle pour la moyenne d'une loi normale d'écart type connu 


L'exemple introductif se situait dans ce cadre-là et nous avons obtenu un inter- 
valle de confiance, de niveau 1 — &, pour le paramètre m, centré sur l’estima- 
teur X, : 


= o _ o 
X,-u— <m<X,+u— 


NS NS 


où u est le fractile d’ordre 1—«æ/2 de la loi normale standard, soit 
u = D !(1 — æ/2). Cet intervalle est de longueur non aléatoire / = 2uo/,/n, 
proportionnelle au niveau de confiance par l’intermédiaire de # et inversement 
proportionnelle à la taille de l’échantillon par le terme 1/,/n. Pour un niveau de 
confiance fixé, c’est l’intervalle symétrique de longueur minimale puisque la loi 
de l’estimateur utilisé est symétrique. 


2) Intervalle pour la moyenne d'une loi normale d'écart type inconnu 


La statistique utilisée dans la situation précédente, et dont la loi était connue, 
était la variable normale centrée-réduite : 


X, — X, — 
m 7. 
o/Vn o 


Elle ne peut plus convenir ici puisque le paramètre o est inconnu et va donc 
devoir être remplacé par un estimateur, basé sur la variance empirique modifiée 
qui est un estimateur sans biais de la variance théorique o° : 


m 


1 L = 
n D (XX) 


i=1 


On utilise donc comme nouvelle statistique : 
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dont la loi est connue ; en effet, si nous divisons numérateur et dénominateur par 
o, elle peut aussi s’écrire : 


m) / (o/Vn) 


ere D 


où on voit que le numérateur suit une loi normale centrée-réduite et que le déno- 
minateur est la racine carrée d’une v.a. de loi du khi-deux réduite (divisée) par 


son nombre de degrés de liberté, car nous avons vu au chapitre 5 que 
2 


S : 
(RE LES x?,. Comme d’après le théorème de Fisher numérateur et 
(4 


jure _—. a X,—m 
dénominateur sont indépendants, on en conclut que la statistique /n Se À 
n 
utilisée ici, suit une loi de Student à n — 1 degrés de liberté. Par lecture de la 
table 6, on peut donc déterminer la valeur de f telle que : 


X, — 
fps 


La valeur de t est donc le fractile d’ordre 1 — «/2 de la loi de Student 7,_:. 
L’intervalle a bien sûr été choisi symétrique puisque la loi utilisée est symé- 
trique. Par inversion de cet intervalle, on obtient : 


os en S 
P(R TE <m<X +) = 1-0 


ce qui fournit l'intervalle de confiance pour m de niveau 1 — &, centré sur X,, 
mais ici de longueur aléatoire L, = 21$,//n. 


Exemple 7.11 


Sur un échantillon de n — 30 durées de vie d’un certain modèle de lampe 
on a obtenu comme moments empiriques X30 = 2000h et $30 = 300. 
L'intervalle de confiance de niveau 0,95 pour la durée de vie moyenne m 


est donc : 
530 530 


— <m < X39 + 
V30 nv 50 


où t est défini par P (—t < T9 < t) = 0,95 ou P (T» < t) = 0,975 soit 
t — 2,045 d’où l'intervalle : 


X30 — f 


1888 < m <2112 
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de longueur | — 224 h observée sur cet échantillon. Si o avait été connu, 
de même valeur que celle observée sur l'échantillon, soit o — 300, l’in- 
tervalle correspondant aurait été : 


. Oo . o 
X30 —U > <M < X39 FU —— 


V30 V30 


avec u = P 1 (0,975) = 1,96 soit l'intervalle 1 893 < m < 2107, de 
longueur l = 214 h, inférieure à la précédente. Ainsi, même en cas d’es- 
timation parfaite, c’est-à-dire telle que s, = ©, l’intervalle obtenu est 
plus grand ; la connaissance du paramètre o conduit logiquement à un 
intervalle plus précis. 


3) Intervalle pour la variance d'une loi normale d'espérance connue 


Pour estimer la précision d’un thermomètre, on réalise n mesures indépendantes 
de la température d’un liquide qui est maintenu à température constante, égale à 
20 degrés Celsius. Compte tenu des erreurs de mesure, la valeur indiquée par le 
thermomètre peut être considérée comme une v.a. normale dont la moyenne m 
est la valeur exacte de la température, soit ici m = 20, et dont l’écart type o est 
inconnu et caractérise la précision du thermomètre. L’estimateur, basé sur 
l’échantillon (X:,...,X,) de cette loi N (m,o), est ici : 


1 n 
DES, da X:= mn 2 


estimateur sans biais, convergent et efficace, de loi connue : n6?/o° ++ x?.On 
peut donc déterminer les valeurs de a et b telles que : 


22 
Pa<n® <5)=1-e 


© 


ce qui conduit à l’intervalle de confiance défini par : 


22 22 
© a 

Pin <o <n—|=1-«x 
b a 


Cependant, il n’y a qu’une seule condition pour déterminer les deux valeurs 
a et b et il reste un degré d’incertitude puisque la loi utilisée n’est pas symé- 
trique. Si on pose &, = P Le < a) et @) = P (x2 > b), la seule contrainte 
dans le choix de æ, et & est &1 + @: = «@. Dans l’exemple retenu, si on a obser- 
vé sur un échantillon de taille 15 la valeur 6°, — 18 et qu’on retient un inter- 
valle à erreurs symétriques (choix le moins arbitraire), pour un niveau de 
confiance 1 — & — 0,99 on lit dans la table 5 les valeurs a = 4,60 et b = 32,8 
d’où l’intervalle : 


8,23 < o° < 58,70 
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Mais, compte tenu de l’interprétation du paramètre qui mesure ici un degré 
d’imprécision, on souhaite qu’il soit le plus faible possible et on retient plus logi- 
quement un intervalle unilatéral à gauche, de la forme o? < constante, ce qui 
correspond au choix &, = & = 0,01 et æ, = 0, soit a = 5,23 et l'intervalle : 


o? < 51,63 
4) Intervalle pour la variance d'une loi normale d'espérance inconnue 


Quand le second paramètre m de la loi normale est inconnu, l’estimateur sans 
biais et convergent de o? qu’il faut retenir est : 


1 L He 
n D (XX) 


i=1 


Sa loi est connue, (7 — 1) S?/0? ++ x?,,et on peut donc déterminer les 
valeurs de a et b telles que : 


S2 
Pla<m-D <5l=1-a 
o 


ce qui permet d’en déduire l’intervalle de confiance défini par : 


S? S? 
Pin-1)“<o?<(n—-1) “i=1-a 
b a 

Là encore, il n’y a qu’une seule contrainte pour déterminer les valeurs de a 
et b ; si nous posons &, = P be: < a) et = P Lo > b) la contrainte est 
Œi + A2 = A. 


Exemple 7.12 


Sur un échantillon de seize chiffres d’affaires de magasins d’une chaîne de 
grandes surfaces on a observé s?, = 72,53. L'intervalle de niveau 0,95 à 
risques symétriques est défini à partir de &; = @2 = 0,025 et on lit dans la 
table 5, a — 6,26 et b — 27,49 d’où l'intervalle 39,56 < a? < 173,79. Si 
on fait le choix d’un intervalle unilatéral à gauche, soit &, = & = 0,05 et 
@ = 0 on obtient a = 7,26 et l'intervalle o? < 149,86 qui est de lon- 
gueur plus grande que le précédent. 


Tous les intervalles précédents ont été construits à partir d’une statistique 
dont la loi était indépendante du paramètre 9 à estimer et que l’on appelle une 
fonction pivotale pour 6. Cependant, dans certains problèmes on peut seulement 
trouver une fonction quasi pivotale pour 6, c’est-à-dire une statistique dont 
seule la loi asymptotique est indépendante de 8. 
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5) Intervalle pour l'écart type d'une loi normale d'espérance connue 


Supposons pour simplifier que la loi normale soit centrée ; l’estimateur naturel 
de la variance o?, c’est-à-dire l’estimateur de la méthode des moments, sans 


biais et convergent, est : 
1 n 
o? = — ) x 
n £ 
i=1 


et sa loi est connue : 10/0? ++ x}. Si on retient o, comme estimateur de ©, cet 
estimateur ne pourra pas être sans biais, car dans ce cas on aurait 
V (o,) = E (0?) — E?(0,) = 0° — o? = 0. On démontre que cet estimateur est 
: . Le 1 En 
asymptotiquement sans biais, avec E (o,) = oa, où a; = 1 — — + — avec 
2n n 
€, — 0 quand n — ©. Nous allons écrire la vraisemblance pour établir que o, 
est l’emv de o : 


1 1 
L (x1,...,%5 ©) = Exp . 


CV) 


et la log-vraisemblance s’écrit : 


i 


1 n 
InL (x1,...,x,;, oO) = In27 nlno ri 


d’où en dérivant : 


cette dérivée s’annule pour o = o, et la dérivée seconde : 


dnL n 3, 
Aa Ter lof x 


._n 3n0? 2n . 
a pour valeur en ce point — = ; < 0 ; cette valeur correspond bien 
o, (y y 
n n n 


à un maximum. La quantité d’information de Fisher peut se calculer ici par : 


PInL\  n 3nE(X) 2n 
00? 


nG=E ( 


o? o4 o? 
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Pour obtenir un estimateur qui puisse être efficace, il faut d’abord qu’il soit 
sans biais et c’est le cas ici de l’estimateur 6, = o,/a,. Sa variance vaut : 


: V(o,) o—a 0?  o° 
V (on) = —> m2 5h (+E,) 


et donc 6, est asymptotiquement efficace. Bien que la loi exacte de 6, ne soit 
pas connue, on va pouvoir construire un intervalle de confiance à partir de la 
fonction pivotale no?/o? pour o°. On peut en effet déterminer les valeurs de a 


et b telles que : 
2 
Pa<n <5)=1-a 
o 


et, comme la fonction racine carrée est croissante, on en déduit l’intervalle de 
confiance pour © défini par : 


În n 
P(o F<o<o/t)=1-a 
b a 


Exemple 7.13 


Sur un échantillon de taille n = 100 on veut construire un intervalle de 
confiance de niveau 0,95 pour © à partir de l'observation 049 = 1,945. 
Si on retient un intervalle à risques symétriques, on lit dans la table 5 les 
fractiles a — 74,22 et b — 129,56 d’où l'intervalle 1,23 < © < 1,62 de 
longueur 0,39. 


Nous allons comparer l’estimateur précédent à un estimateur basé sur l’écart 
absolu moyen : 
1 n 
D RÉ ) IX il 
n £ 
i=1 
Son espérance est égale à celle de : 


E (IX = Po gx 


1 (ia | | 
EE — XIe 
GN2RT 


soit, avec le changement de variable x? = 20°?u : 


2 . Pr 2 
E (IX1) = de [7e "odu = Aer e"du = sJ2 


L’estimateur sans biais que l’on retient est donc : 
TT 
T, —= 3 Pa 
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D’après la loi des grands nombres : 


D, — E(IXN) 
P 


donc 7, est convergent. Sa variance est : 


- 2 


Si on compare les deux estimateurs sans biais 6, et T, : 


V(T) _ (m—-2)a} 
V(G)  2n(1— a?) 


> T—-2>l 


donc 56, est préférable à T, , ce qui était prévisible car nous avions vu qu’il était 
asymptotiquement efficace. 


Pour construire un intervalle de confiance, nous allons utiliser la loi asymp- 
totique de l’estimateur 7, , déduite du théorème central imite : 


D, — E(IX|) 
v AD a 
d’où 
T, — © 
oder 


T, — © 


ce qui conduit à l’intervalle de confiance : 


T, T, 
lune min euh 


Exemple 7.14 


Sur le même échantillon que dans l'exemple 7.13, de taille n — 100, on a 
observé d, = 1,084. L'intervalle de niveau voisin de 0,95 est alors 
1,16 < o < 1,56 de longueur 0,40. 
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À retenir 


Un estimateur est une statistique, c’est-à-dire une variable aléatoire 
fonction d’un échantillon, dont les réalisations sont censées être proches de 
la valeur inconnue du paramètre à estimer. Pour qu’il en soit ainsi, on 
demande à cet estimateur de posséder un certain nombre de propriétés, 
comme par exemple d’être sans biais, 1.e. d’avoir une valeur moyenne (au 
sens d’espérance) égale au paramètre à estimer. On souhaite ensuite qu’il 
soit le plus efficace possible, 1.e. qu’il ait une dispersion, mesurée par la 
variance, la plus petite possible. Dans certaines conditions, notamment 
quand l’ensemble des valeurs possibles pour la variable ne dépend pas du 
paramètre à estimer, on peut trouver un estimateur optimal, qu’on appelle 
efficace, et qui est le meilleur estimateur sans biais que l’on puisse obtenir. 


S1 un estimateur est seulement asymptotiquement sans biais, 1.e. que son 
espérance tend vers le paramètre quand la taille de l’échantillon devient 
infinie, sa qualité est mesurée par l’erreur quadratique moyenne. 


Un estimateur est dit convergent s’il converge en probabilité vers le 
paramètre à estimer. Tout estimateur sans biais, ou asymptotiquement sans 
biais, dont la variance tend vers zéro est convergent. 


S1 le paramètre à estimer est la moyenne (espérance) de la loi, la moyenne 
empirique est un estimateur sans biais et convergent. 


S1 le paramètre à estimer est la variance de la loi, la variance empirique 
modifiée (divisée par r — 1 au lieu de ñn) est un estimateur sans biais et 
convergent. 


Dans les autres cas, on construit un estimateur par la méthode des 
moments ou la méthode du maximum de vraisemblance. 


Compléments 


négalité de Fréchet-Darmois-Cramer-Rao 


Nous allons préciser les hypothèses de Cramer-Rao évoquées dans l’énoncé du théorème 
présenté partie IL, $ C, 2. L'ensemble © est un ouvert sur lequel la densité f (x; 4) ne s’an- 
nule en aucun point x et est dérivable par rapport à 4. On suppose également que l’on peut 
intervertir dérivation par rapport à Ô et intégration, et que la quantité d’information de Fisher 
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est strictement positive. La variance d’un estimateur sans biais est donc minorée par un 
nombre positif, d’autant plus petit que l’information de Fisher est grande. On ajoute souvent 
l'hypothèse que la densité est deux fois dérivable par rapport à 0 et que l’on peut toujours 
intervertir dérivation par rapport à Ô et intégration. On obtient alors une autre expression de 
l'information de Fisher, vue au $ IL C, 2, et généralement plus simple à calculer. 


L’inégalité FDCR se généralise au cas où le paramètre à estimer est g (0), g étant 
une fonction réelle. Si 7, est un estimateur sans biais de g (4), si on peut encore échan- 
ger dérivation par rapport à 0 et intégration de T, , alors : 


[Le 6) 


Si l’estimateur présente un biais b, (0), alors : 


[b!, (6) + 8’ @)T 


Vo (Ta) > b2 (0) + 16) 


L’inégalité FDCR se généralise également au cas multidimensionnel, ® étant un 
ouvert de R?, l'information de Fisher devenant la matrice dont l’élément ligne i, colon- 


ne j,1<i,j < p,est: 
dInL  ôlnL 
Ep X 
CICA 06; 


ou, dans le cas où on peut dériver deux fois et échanger avec l’intégration : 


9?InL 
Eo | — —— 
06:06; 
Si 7, est un estimateur sans biais de g(0), g étant une application de R? dans R?, 
alors l’inégalité FDCR se traduit par l’affirmation que la matrice : 


d d 
= (4) 1-1 (0) (4) 


d 
est semi-définie positive, Fe. étant la matrice dont l’élément ligne i,1 < i < g, colonne j, 


1<j< pret 5 avec g = (Btsssga) 
06; 


tatistique exhaustive 


Dans l'exercice 3, pour une famille de lois géométriques, on établit que l’information appor- 
tée par la somme des observations est égale à celle apportée par les données individuelles. 
Ainsi, la connaissance de cette seule statistique n’a pas diminuée l’information apportée par 
toutes les données. Nous allons voir sur un autre exemple comment peut se traduire cette 
propriété intéressante pour une statistique et qui conduira à la notion d’exhaustivité. 


224 e STATISTIQUE ET PROBABILITÉS 


© Dunod. Toute reproduction non autorisée est un délit. 


Exemple 7.15 


Considérons un contrôle industriel de pièces défectueuses, effectué en tirant avec 
remise n pièces dans un lot, pour connaître la proportion 0 de défectueuses. 
À chaque pièce tirée on associe une v.a. de Bernoulli : 


1 0 
2 — Li< 
X; Lo 1-0 1<i<n 


Le rang de tirage des pièces défectueuses n'apporte évidemment aucune infor- 
mation sur le paramètre 0 et toute l'information apportée par l'échantillon 
n 


(X1,...,X,) est contenue dans la statistique T (X:,...,X») = + X; qui suit 
i=l 

une loi B (n,0). Pour préciser cette évidence, nous allons déterminer la loi d’un 

échantillon lorsque cette statistique a une valeur fixée f, soit : 


P, (Xi = Xi Xp = Xn,T = 1) 


Po (Xi = X1,..., Xn = Xn|T = f) = Po(T =t) 
 (T = 


On a Py (Xi = xi) = 0% (1— 0)! 7%, x; € {0,1} er donc : 
n—1 
P), (Xi = XX = x, Te t) = m(x = XX = x) 


_ 0! (1 ee C)ies 


Comme : 


n 
PT =t)= (re a = pt 


n 
résultat prévisible en remarquant que ( N ) représente le nombre de choix des t 


on en conclut : 


Po (Xi = X1,...,Xn = x, IT = t) = 


indices i pour lesquels x; = 1. On constate donc que cette probabilité est indé- 
pendante du paramètre inconnu 6. 


Cet exemple nous montre que si la loi de l’échantillon, conditionnellement à une 
valeur fixée de la statistique, est indépendante de la loi de X, c’est-à-dire du paramètre 0, 
cela traduit le fait que les valeurs individuelles n’apportent pas plus d’information sur 0 
que la seule valeur de T'. Nous dirons qu’une statistique T, est exhaustive (sufficient) si 
la loi conditionnelle de (X:,...,X,) pour T = f fixé est indépendante de 0. Cette pro- 
priété d’exhaustivité pourra se démontrer facilement à l’aide du résultat suivant. 


Théorème de factorisation (Neyman-Fisher) 


Une statistique 7, est exhaustive s’il existe deux applications mesurables positives g 
et À telles que la densité L de l’échantillon puisse se factoriser sous la forme : 


L (x, ,%n5 0) = 8 (: 0) h (x... ,xn) 
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Cette factorisation n’est bien sûr pas unique, mais la quantité A (x1,...,x,) = 
D (X1,...,Xn: 1 (X1,...,Xn)) peut représenter la densité de (X1,...,X,)[T, =t et 
dans ce cas g (f; 0) est la densité de T,. 


Exemple 7.16 
Soit X une va. de loi E (1/0) = y (1,1/0) et considérons la statistique 
Th = >. X; qui suit la loi y (n,1/0). La vraisemblance s'écrit : 


i=1 
n 1 1 n 
ESS HE (TT 65) ) ges - à >: 


i=1l i=] 


= g(t;0)h(xi1,...,Xn) 


en ayant posé g (t; 0) = 1/0"e-/ et h (x1,...,Xn) = LR (X1,...,Xn), ce qui 
montre que T, est exhaustive. Mais on peut également prendre : 


10) = 60" tom lt (+ 
En r © 
qui est la densité de T,, et dans ce cas : 
F (n) n—1)! 
h(X1,...,Xn) = on (x1,...,Xn) = — (X1,2..,Xn) 


est la densité de l'échantillon conditionnellement à T, = t. 


Quand T prend ses valeurs dans l’espace des paramètres ® , on dit que T est un résu- 
mé exhaustif pour 0. Quand T' est à valeurs dans R°, on dit que T° est une statistique 
exhaustive d’ordre s. Une statistique exhaustive pour un échantillon est bien entendu 
exhaustive pour toute fonction de cet échantillon. 


Dans l’exemple précédent, nous aurions pu choisir d’autres statistiques exhaustives 
comme par exemple (X1 + X2,X3,...,X) (Xi + X2 + X3,X4 :X;) ... où 
l'échantillon lui-même (X1,X2,...,X,) puisque l’application identique est toujours 
une statistique exhaustive. Notons aussi que 7, est une fonction de toutes ces statistiques. 
Il est donc souhaitable de réduire au maximum l’espace des observations sans perdre 
d’information sur 0. C’est ce que réalise une statistique exhaustive minimale (minimal 
sufficient, ou necessary and sufficient) S qui est une fonction de toute autre statistique 
exhaustive T. De façon précise, si T est à valeurs dans G et S à valeurs dans F', alors 
il existe une application mesurable g : G — F telle que S = g (T). 


Nous allons introduire une troisième notion et faire le lien entre elles. Une statistique 7° 
est dite complète (ou totale) si toute v.a. À telle que h (T) est d’intégrale nulle pour P; est 
nulle P; -presque partout. Avec cette nouvelle définition, on peut énoncer le résultat suivant. 


Théorème 


Toute statistique exhaustive et complète est minimale. 


Il faut cependant faire attention : une statistique exhaustive minimale n’est pas for- 
cément complète. 
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amille exponentielle 


La famille des lois exponentielles joue un rôle très important en statistique car elle pos- 
sède un certain nombre de propriétés intéressantes. Il s’agit des lois dont la densité peut 
s’écrire sous la forme : 


k 
f (10) = a (6)b (x) exp D a; (@)T; c)] 


= 


Exemple 7.17 


Loi binômiale : 
n[(n P 
f@p)=(-p) ( Jason ) 
x 1—p 


et T(x)=x 


Eee P 


Exemple 7.18 


Loi de Poisson : 


1 
f (x; 0) = e ?—exp (xIn6) 
x! 


a(0)=In0 et T(x)= x 


Exemple 7.19 
Famille des lois y (p; 0) : 


CL 
f (x; p,0) = TG) + (x) exp [—0x + (p — 1) Inx] 


di = —0,@4 = p—1 et Ti(x) = x, (x) = Inx 


Le théorème de factorisation permet de conclure que la statistique : 


T (Xi... Xn) = œ MON Te a) 
i=1 i=1 


est exhaustive. En effet, la vraisemblance s’écrit dans ce cas : 


n k 
Lise 495 0) = a" (6) (Tec Jesr DE @) | 
i=1 j=1 


n 
ayant posé T; — D T; (x;) . Dans le cas où les fonctions «; sont linéairement indépen- 
i=l 
dantes, cette statistique est de plus minimale. On fait alors le changement de paramètres 
0; = a;(0),1 < j <K, dans la famille exponentielle, ce qui correspond à une nouvelle 
famille P, où 0 = (6:,...,0;) est appelé paramètre naturel de la famille exponentielle. 
On peut énoncer le résultat suivant. 
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Théorème 
Si la densité de la famille exponentielle s’écrit sous la forme : 


k 
f x: 6) = a (8)b (x) exp ds 6;T; c)| 


j=l 

où 0 = (@1,...,0;) appartient à ® qui contient un pavé de R# (ou qui est d’intérieur 

non vide), alors la statistique T = (T:,...,1%) est exhaustive, complète et minimale. 
Exemple 7.20 ; 


Loi binômiale : T (x) = x, donc > X;, ou X,, est une statistique exhaustive et 
complète pour le paramètre p.  i=1 


Exemple 7.21 


Loi de Poisson : X, est une statistique exhaustive et complète pour le paramètre 0. 


Exemple 7.22 


Famille des lois y (p; 0) : la statistique (n = D x, = Dix.) est 
exhaustive pour le paramètre (0, p). i=l i=1 


Exemple 7.23 


Loi normale : 


f @: 8) = 


1 e-"/20° m ss 
= 5 exp [5x - 5x 


n n 
etT = ( D X;, s X ) est exhaustive complète pour le paramètre 0 = (m,o?) ; 
i=l i=1 


Dans le cas où l’ensemble E = X (Q) des valeurs possibles pour X est indépendant 
du paramètre Ô , le théorème de Darmois-Koopman énonce que l’appartenance à la famil- 
le exponentielle est une condition nécessaire et suffisante d’existence d’un résumé 
exhaustif d'ordre k pour un paramètre vectoriel. 


Exemple 7.24 


Loi de Cauchy : 1 1 
X3 0) = — 
f (x: 0) FITO-a 


cette densité n'appartient pas à la famille exponentielle, donc il n'existe pas de 
résumé exhaustif pour 6. 


Exemple 7.25 


Loi uniforme sur [0,6] : 


1 
f (x; 0) = g we! (x) 


cette densité n'appartient pas à la famille exponentielle et cependant on peut éta- 
blir grâce au théorème de factorisation que X(ny = max{X1,...,X,} est une 


228 e STATISTIQUE ET PROBABILITÉS 


© Dunod. Toute reproduction non autorisée est un délit. 


statistique exhaustive pour Ô. Ceci provient du fait que le théorème de Darmois- 
Koopman ne s'applique pas, l’ensemble E = X (Q) = [0,0] dépendant du 
paramètre 0. 


La famille exponentielle permet d’obtenir un estimateur efficace et comme le théo- 
rème suivant le précise, c’est une condition nécessaire. 


Théorème de Koopman 


Sous les hypothèses de Cramer-Rao, la dérivée de f par rapport à O étant continue 
en Ô, si 7, est un estimateur sans biais du paramètre réel g (0) , alors T, est un esti- 
mateur efficace si, et seulement si, il existe des fonctions réelles &,B et y telles que : 


nf (x;:0)=B(@)+7y(@x)+a(8)T (x) 


—. le : 
La statistique T, = — » T (X;) est exhaustive, complète et minimale et constitue 
n { 
p=il 
un résumé exhaustif d’ordre un; c’est aussi un estimateur efficace du paramètre 
g (0) = —B' (6) /æ«’ (8) qui est le seul paramètre que l’on peut estimer efficacement 
(ou une fonction affine de celui-ci) et qui n’est pas forcément le paramètre d’intérêt. 


Exemple 7.26 


Loi de Poisson : 
In f (x; 0) = —0 — Inx! + xing 


B (8) = —6,a (0) = In0,T (x) = x 
1 n 

L'estimateur Ty = — >. X; est efficace pour g (0) = 0. 
ni 


Exemple 7.27 
Famille de lois y (p) : 


nf (x; p) = —Inl (p) — x + (p — 1)Inx 


B (Cp) = IT (p),«(p) = p — LT (x) =Inx 
1 n 
L'estimateur Ty = — Y InX; est efficace pour g (p) = T’(p)/T (p) qui est 
rs 


un paramètre de peu d'intérêt. 


mélioration d'un estimateur 


L'existence d’une statistique exhaustive pour le paramètre permet d’améliorer, en utili- 
sant le critère de la variance, un estimateur sans biais. 
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Théorème de Rao-Blackwell 


Si T est une statistique exhaustive pour la famille P et S un estimateur sans biais 
de g (0) , l’estimateur E, (SIT) est sans biais et préférable à S. 


L’espérance conditionnelle E; (SIT) permet bien de construire un estimateur, car 
elle est indépendante de @ en raison de l’exhaustivité de T. 


Avec le critère de la variance, on peut espérer trouver un estimateur optimal dans 
la classe des estimateurs sans biais de variance finie. Cet estimateur n’est pas néces- 
sairement efficace, mais bien sûr s’il existe un estimateur efficace il est optimal. Dans 
le cas d’une statistique exhaustive complète, l’estimateur amélioré de Rao-Blackwell 
est optimal. 


Théorème de Lehmann-Scheffé 


Si Test une statistique exhaustive complète pour la famille P, et S un estimateur 
sans biais de g (0), l’estimateur Æ9 (SIT) est optimal dans la classe des estimateurs 


sans biais. 

Exemple 7.28 

Pour la loi uniforme sur [0,0], S = 2X, est un estimateur sans biais de 0. On 
peut établir que X(, = max {X1,...,X,} est une statistique exhaustive et com- 
plète pour 0. Donc l’estimateur Eo (2X;1X() est sans biais et optimal. En 
écrivant : 

_ 1 n—1 LE 
Ep (XX) = au 2 Xo1Xon 
+1 


on établit que Ep (2X1X 5) = ———X(. 
n 
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Exercices 


noncés 


Exercice n°1 


À partir d'observations indépendantes (X1,...,X,) d’une certaine grandeur écono- 
mique X, on retient le modèle suivant : 


X,;,=a(l+e), 1<t<n 
où les v.a. £, sont indépendantes et de même loi normale standard. 
1) Déterminer l’estimateur du maximum de vraisemblance &, de a. 
2) Étudier les propriétés de l’estimateur de a obtenu par la méthode des moments. 


3) Proposer un estimateur de la variance du modèle. 


Exercice n°2 


Afin d’organiser au mieux l’accueil des groupes de visiteurs d’un parc d’attractions, on 
note la durée X séparant l’arrivée de deux groupes successifs. À partir des observations 
(X1,...,Xh) recueillies dans une journée, on retient comme modèle la loi uniforme sur 


[0,0]. 

1) Déterminer par la méthode des moments un estimateur sans biais du paramètre 0 > 0 
et étudier ses propriétés. 

2) Déterminer par la méthode du maximum de vraisemblance un estimateur sans biais du 
paramètre Ô et étudier ses propriétés. Comparer les deux estimateurs. 


Exercice n°3 


Une v.a. X suit une loi uniforme discrète sur l'ensemble des entiers {1,2,...,0} où 0 est 
un entier positif inconnu. Déterminer, par la méthode des moments, un estimateur de 0 
construit à partir d'un échantillon (X1,...,X,) de X et étudier ses propriétés. Est-il effi- 
cace ? 

Exercice n°4 


Une urne contient un nombre de boules inconnu 0 > 2, une seule d'entre elles étant 
blanche. On effectue dans cette urne des tirages successifs avec remise, jusqu'à ce qu'on 
obtienne une boule blanche et on note X la variable aléatoire qui représente le nombre 
de tirages effectués. À partir d'un échantillon (X:,...,X,) de X, déterminer un estima- 
teur T, de @ par la méthode des moments. Étudier ses propriétés. Est-il efficace ? 


Exercice n°5 
Soit X une variable aléatoire dont la densité a pour expression, pour x > 1 : 


1 
f(x) = à x71/0-T avec 0 > 0 


et nulle sinon. 


1) Calculer E(X) et en déduire un estimateur 7, de 0 par la méthode des moments, 
construit à partir d'un échantillon (X:,...,X,) de X. 
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2) Déterminer la loi de probabilité de la variable aléatoire Y = In X. 


3) Déterminer l'estimateur 6, du paramètre © par la méthode du maximum de vraisem- 
blance et étudier ses propriétés. Est-il efficace ? 


n 
4) On pose Z, = > In X;. Déterminer la loi de probabilité de 2Y, /6 et en déduire un 
i=l 
intervalle de confiance bilatéral pour @ de niveau 1 — «. 


Exercice n°6 


Le total des ventes hebdomadaires d’un produit alimentaire dans un magasin i,1 <i <n, 
est une v.a. X; de loi normale N (m;,0) où les valeurs m; et o sont supposées connues. 
Une campagne publicitaire de ce produit a pour conséquence d’augmenter les ventes, de 
telle sorte que chaque moyenne m; est augmentée d’une même quantité a. 


1) Déterminer un estimateur de a construit à partir d'observations indépendantes 
(X1,...,Xh) des ventes après cette campagne et étudier ses propriétés, puis construire 
un intervalle de confiance de niveau 0,95. 


2) Déterminer un estimateur du paramètre b dans le cas où chaque moyenne mn; est cette 
fois multipliée par b et étudier ses propriétés. 


3) Application aux données suivantes dans le cas où o = 3. 


mi; | 98 101 104 99 100 102 95 97 105 103 


x; |109 105 110 106 110 114 108 104 115 118 


Exercice n°7 
La durée de vie d’un certain matériel est représentée par une v.a. positive X de densité : 


L 
Es 
f&0)= 08 | 

0 six < 0 


six >0 


où 0 est un paramètre inconnu strictement positif. 


Étudier les propriétés de l’estimateur du maximum de vraisemblance 4, construit à par- 
tir d’un échantillon (X:,...,X,) de la va. X. 


Construire un intervalle de confiance pour @ de niveau 0,95 dans le cas où les observations 
10 

ont conduit à 2 = 11,5: 
i=l 

Exercice n°8 


Soit (X1,...,X,) un échantillon d’une va. X de loi log-normale de paramètres m et 
o > 0. 


Étudier les propriétés de l’estimateur du maximum de vraisemblance de m. 


Construire un intervalle de confiance pour M de niveau 0,95 dans le cas où o = 1 et où 
25 


on a observé > Inx; = 54,94. 


i=1 
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Exercice n°9 


Soit X une v.a. de densité : 


2x . 
f&n=l7 Si0<x<6 
| O sinon 


où Ô est un paramètre strictement positif. 


1) Déterminer un estimateur de @, par la méthode des moments, construit à partir d’un 
échantillon (X1,...,X,) de X, et étudier ses propriétés. 


a 
2) Déterminer un estimateur sans biais 0, de 0, construit à partir de l’estimateur du 
maximum de vraisemblance, et étudier ses propriétés. 


3) Construire un intervalle de confiance de niveau 0,95 pour 4 dans le cas où on a obser- 
vé max {X1,...,X20} = 5. 
Exercice n°10 


Deux ateliers de fabrication produisent des doubles-vitrages dont l’épaisseur peut être 
considérée comme une v.a. de loi normale d’espérance m — 6 mm, soit pour chaque ate- 
lier les v.a. X et Y de lois respectives N (m,01) et N (m,02). Pour comparer les carac- 
téristiques de fabrication de chacun de ces ateliers, on prélève respectivement n1 et ñ2 
vitrages d’épaisseurs notées X1,...,X,, et Ÿ1,...,Y,,. Construire un intervalle de 
confiance de niveau 1 — @ pour le rapport &; 10%. 

Exercice n°11 


Soit (X1,...,X,) un échantillon d’une va. X de loi normale d’espérance et de varian- 
ce égales à un paramètre inconnu @ > 0. 


1) Déterminer deux estimateurs de 0 par la méthode des moments, étudier leurs proprié- 
tés et les comparer entre eux. 


2) Construire un intervalle de confiance pour Ÿ de niveau 0,95 ayant observé : 


25 25 
Dh) Gr) = 4810 


i=1 i=1 


Exercice n°12 


Soit X une variable aléatoire dont la densité a pour expression : 
0 
@) = eh 
f 2 
où 6 est un paramètre réel strictement positif. 


1) Déterminer l’estimateur 6, du paramètre @ par la méthode du maximum de vraisem- 
blance, construit à partir d’un échantillon (X:,...,X,) de X et étudier ses propriétés. 
Est-il efficace ? 


2) On pose X, — ÿ: IX;|. Déterminer la loi de 20Y, et en déduire un intervalle de 
i=1 
confiance bilatéral pour 4 de niveau 1 — «. 


3) Déterminer la loi limite de 6, et en déduire un intervalle de confiance bilatéral pour @ 
de niveau voisin de 1 — &. 


Estimation e 233 


Exercice n°13 
Soit X une v.a. de densité : 
1 


—V/x/0 . 0 
Feb NTM Si x > 
0 six <0 


où Ô est un paramètre strictement positif que l’on se propose d’estimer à partir d’un 
échantillon (X1,...,X,) de X. 


1) Déterminer l’estimateur du maximum de vraisemblance 6, de O0 et étudier ses pro- 
priétés. 


2) Construire un intervalle de confiance de niveau 0,90 pour @ dans le cas où on a 


20 
observé Ÿ | /x = 47,4. 
i=1 


Exercice n°14 


Soit (X,Y) un couple normal dont la densité est définie par : 


(1+ 0)x? + 2(1 + 20)xy + (1 + 40)y?] 


st 1 
FR) = exp — il 


27 V0 


1) Déterminer la loi de X + Y et en déduire un estimateur T, de 0 par la méthode des 
moments construit à partir d’un échantillon de taille n du couple (X,Y). 


2) Étudier les propriétés de T,. Est-il efficace ? Déterminer la loi de T, et en déduire un 
intervalle de confiance bilatéral pour @ de niveau 1 — «. 


3) Déterminer la loi limite de T, et en déduire un intervalle de confiance bilatéral pour @ 
de niveau voisin de 1 — &. 


Exercice n°15 


Soit X une v.a. de densité : 


1 x — 0 ne 
rue = [99 5 si 0 <x 
0 


où 0 est un réel strictement positif. 
1) Calculer E (X) 


2) Soit X1,...,X, des v.a. indépendantes, de même loi que X. Déterminer un estimateur 
T, de 0 par la méthode des moments. Étudier ses propriétés. Est-il efficace? 
3) Déterminer la loi limite de T, quand n devient infini et en déduire un intervalle de 


confiance bilatéral symétrique de niveau voisin de 1 — œ = 0,95 pour 4, dans le cas où 


on a observé la valeur 3. x; = 660 sur un échantillon de taille n = 100. 
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Corrigés 


Exercice n°1 


1) Les va. X, suivent la même loi normale N (a,a), donc la log-vraisemblance a pour 
expression : 


n 1 À 
InL (x1,...,Xxn; a) = ji @x) nina 7e 2. a) 


de dérivées : 


dnL 2n 3 € 4 À 
Cu PDC 


0a? a 


Nous allons poser : 


On peut écrire : 
1 n 
>), a) =s2+G-a) 
1=1 


et on obtient alors : 


oInL n 

He ms (°+# ax a) 
d?InL n 2nx 3n ,, 2 
da? ar a PAL F4 


il = 5 
La dérivée première admet comme racine positive a = 3 V5x? +52 x qui 
vérifie s°? + x? = a? + ax et donc la dérivée seconde admet comme valeur en ce point : 


2n nx 


La vraisemblance est donc maximum en ce point, l’expression de l’emv étant donc : 


Re . 
à => (sx, + 52 x.) 
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2) L'expression précédente est beaucoup trop compliquée et il est préférable d’utiliser la 
méthode des moments puisque a = E (X). On peut donc prendre comme estimateur 
sans biais et convergent le moment empirique X,. Calculons l’information de Fisher : 


d2InL n 2na  3n = . 
n@=E = )- re e(x) +5 (52) 


2 _ 
avec E(X;) = V (X) + E? (X5) = _ +a?etE (5?) = 1e on obtient : 
wo? 
Ainsi : . s 5 
VR)=T> 27 


donc cet estimateur n’est pas efficace. 


3) Le modèle a pour variance a? dont un estimateur sans biais et convergent est Se On 


pourrait prendre aussi comme ÉAeNE x qui, d’après ce qui précède, est un estima- 
teur asymptotiquement sans biais de a?. 


Exercice n°2 


1) Comme E (X) = l’estimateur est obtenu par la méthode des moments comme 


0 
2 
solution de l’équation X, = 


—, soit T, = 2X,. Cet estimateur est sans biais et conver- 
gent, de variance : 2 


aV@ CE 
n "3 


V (Ts) = 4V (X;) = 


La question de l’efficacité d’un estimateur ne se pose pas ici car nous ne sommes pas 
dans les conditions d’application de l’inégalité FDCR, l’ensemble des valeurs possibles 
pour X étant X (92) = [0,6] qui dépend donc du paramètre à estimer. 


2) La vraisemblance a pour expression : 


07" si0 < minx; < max x; < 0 


L Creer 0) = | D se 


Ainsi, L est nulle pour 0 < max x; et ensuite est décroissante pour 0 > max x;, donc 
est maximum pour Ÿ — max X;, ce qui correspond à l’emv : 


M, = max{X:,...,X,} 
Pour étudier ses propriétés, nous devons déterminer sa loi de probabilité : 


n 


ru, <o=r fu < 0} = [Tr < 0200 
i=1 


i=1 


en raison de l’indépendance et de l’identité des lois des va. X;, de fr. F. La densité de 
M, est donc : 
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nx"7l 


8 (= n FT (0) f (= ho 
0 sinon 
Par conséquent : 
n 0 n 
E (M) = — |, x'dx — Q 
(Mn) g" Jo n +1 
et l’estimateur sans biais est donc : 
= n +1 
On = M, 
n 
Pour calculer sa variance, on calcule d’abord : 
n 0 n 
E (M2) = — fj x'tldx = 0? 
(M) = 3x do n +2 


d’où on déduit : 


V (M,) = 2 
 (n+D?(n+2) 
puis : 
2 0? 
V (8,) = PER) 


ce qui montre que 6, est convergent. Le rapport : 


V(@) _ 3 _ 
AT 


montre que 6, est infiniment plus efficace que 7,. 


Exercice n°3 


La va. X admet comme espérance E (X) = ee . La méthode des moments consiste à 


écrire l'égalité entre moment théorique, ici l'espérance, et moment empirique correspon- 
dant, ici la moyenne empirique X,. On résout donc l'équation en 6 : 
O0+I 


SR ES A 
2 


La solution donne l'estimateur T, = 2X, — 1. Cet estimateur est sans biais : 


E(T;)=E(2X,-1)=2E(X;)-1=2E(X)-1=0 
Il est aussi convergent d'après la loi des grands nombres : 


. 1 
Re Ho 
p 2 


On en déduit du théorème de Slutsky que : 


Ty =2X;y-1——2E(X)-1=0 
P 
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La question de l'efficacité ne se pose pas puisque l'ensemble des valeurs possibles pour 
X est {1,2,...,0}, qui dépend du paramètre à estimer 0. 


Exercice n°4 
à: donc avec : 


1 1—-p 
E(X)=—-=0 V(X)=——=0(8—1) 
P P 


La va. X suit une loi géométrique de paramètre p = 


2 


Le paramètre à estimer est la moyenne théorique, donc l'estimateur 7, de @ par la métho- 


de des moments est la moyenne empirique X,. Cet estimateur est sans biais et conver- 
gent d'après la loi des grands nombres. Pour savoir s'il est efficace, on détermine d'abord 
l'expression de la vraisemblance : 


L'(X1,...,Xn : 0) 


[IP&=x=[Tra- px 
Fe Te _ 1) * 


n 1 - Sn —n _ 
p'A— p) Bis 


ayant POSÉ Sn = » x;. La log-vraisemblance est donc : 
InL (x1,...,xn; 0) = (s, — n)ln (8 — 1) — s,1n0 
Soit en dérivant : 


alnL Sn —n Sn 
30 6-1 6 


On dérive une nouvelle fois : 


9?InL Sn —n Sn 
ee 2 + 2 
90 (@—1) 0 
On calcule alors la quantité d'information de Fisher : 
1, (6)=E d2InL = E(S,)—n  E(S,) = n0 —n n0 : n 
6 Ge © 07 UE DS 6, 60-01) 


Par ailleurs : 
__V(X) _60(@—-1) 1 
OR on 7 1, (8) 


FR)= (A) 
L'estimateur T, est donc efficace. 
Exercice n°5 


1) On obtient : 


1 +00 _iy9 
E(X) = n X dx = 1-8 
1 = 


sous réserve que cette intégrale soit convergente, c'est-à-dire que 1 — 1/0 < 0 soit 


0<80<I. 


L'équation X, = 1/(1 — 8) donne comme solution l'estimateur T, = 1 — 1/X,. 
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2) La v.a. Y est positive, donc G(y) = P(Y < y) = 0 pour y < 0. Pour y > 0: 
G(y) = PAnX < y) = P(X <e’) = F(e?) 
où Fest la fr. de X. La densité obtenue par dérivation est : 


16 =e fe) = re" 


qui est la densité de la loi exponentielle de paramètre 1/6. 


3) L'expression de la vraisemblance est : 


à je 11/6 
Lime ]|rGE (;) ( x) 
ren 


i=1 


La log-vraisemblance s'écrit : 


1 n 
In L(x:,...,x1; 0) = —nn0 (: + :) ps 


Cette fonction est dérivable pour tout 4 > 0 avec : 


ôln L n ll 
—= 5e In x; 
i=1 


=. + —— 
00 0 024 
n 
La dérivée s'annule pour 0 = >. In x;/n ; la dérivée seconde est négative pour cette 


i=1 


valeur : 


dnL n ARE 
TE = am 


L'estimateur du maximum de vraisemblance est donc : 


Cet estimateur moyenne empirique est un estimateur sans biais de la moyenne théorique 
de Ÿ et convergent d'après la loi des grands nombres. 


Sa variance est : 


— Y 
VE)= = — 


La quantité d'information de Fisher est : 


9?In L n 2 © n 
1,(0) = E = E(F;) = — 
(8) ( nr.) tp (Y) 


L'estimateur est donc efficace. 
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4) La va. X, est la somme de n v.a. indépendantes et de même loi y (1,1/0) donc suit 
une loi y(n,1/0). On en déduit successivement que X,/0 suit une loi y(n) et que 
2%,/06 suit une loi y(n,1/2) qui est la loi CR (cf. chap. 3, $ IL D et IL, E). On en déduit 


un intervalle de confiance bilatéral pour @ par la condition : 


a 


5, 6, 6, 
1—-a—=P{ia< <b}i=Pi2n — <0 <2n — 
0 b 
a et b étant les fractiles d'ordres respectifs &/2 et 1 — &/2 de la loi LE 


Exercice n°6 


1) Chaque variable X; suit une loi N(m;+a,o),1<i<n ; les variables 
Yi = X; — m; constituent donc un échantillon d’une v.a. Ÿ de loi N (a,o). Par consé- 
quent, l’estimateur : 


est un estimateur sans biais et convergent du paramètre a. 


L'expression de la log-vraisemblance est : 


1 n 
InL (x... ni 4) = Sin (270?) 373 2 Ci mi a) 


de dérivées : 


omL 1 À 
= 5) Ci mi — a) 
il 


0a 
9?InL D _n 
da? oo? 


On remarque ainsi que a, est un emv et qu’il est efficace car : 


o? 1 


FE 


puisque : 


d?InL n 
3 Ja? m4 


n@=E 


(ox 


On obtient un intervalle de confiance à partir de &, dont on connaît la loi, qui est la loi 
normale N (a,o/Vn) as 


_ © me © 
An —U— <A < y +U— 


Vr Va 


où u est le fractile d’ordre 1 — œ/2 de la loi N (0,1), soit u = 1,96 pour & = 0,05. 
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o 
2) Les variables Z; = X;/m; sont indépendantes et de loi N C ) , donc la statis- 
tique : mi 


= 1: 1 = X; 
FDA 
est un estimateur sans biais et convergent, de loi normale d’espérance b et de variance : 
= 1 Lo? 
V (by) = — Y: —_ 
(0) n L m 


La log-vraisemblance a pour expression : 


InL (x1,...,Xn; b) = -;in (270?) — _ >: (x; — bm;) 


de dérivées : 


alnL SE 
L L b L 
3b ee 7 (x mi) 
dInL _ 1 = ; 
db oo? | 


donc l’information de Fisher a pour expression : 


42InL 1 , nm 
LO=E (Te) Dee 


ner es | mat 
en ayant posé M — Nm. La variance de l’estimateur peut aussi s’écrire 
no ni 
V (b;) = Re en ayant noté par À la moyenne harmonique des nombres m?, définie par 
n 
1 1€ 


== —;. Comme les moyennes arithmétique et géométrique vérifient toujours la 


h nm; 


relation h < M, on en conclut que : 
V (b,) # 4. 
In (D) 


c’est-à-dire que cet estimateur n’est pas efficace, sauf dans le cas particulier où tous 
les m; sont égaux. 


3) L’estimation &i0 = 9,5 conduit à l’intervalle : 


_ 7,64 < a < 11,36 
On obtient b10 = 1,095. 


Exercice n°7 


Nous avons vu dans l’exemple 7.8 que l’emv est 6, = X,, qui est donc un estimateur 
sans biais et convergent, comme toute moyenne empirique lorsque le paramètre à estimer 
est la moyenne théorique, avec ici : 
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La quantité d’information de Fisher a pour valeur : 


02 


42InL L_n. 2nE (X) LA 
902 CEE 


n@=E ( 


Donc cet estimateur est aussi efficace. 


Pour construire un intervalle de confiance basé sur 6, on a besoin de connaître sa loi de 
probabilité. On va pour cela utiliser le fait que la loi exponentielle appartient à la famille 
des lois gamma: X ++ € (1/0) = y (1,1/6). Utilisant l’une des propriétés des 


n 
lois gamma on en conclut que S, — >. X; — y(n,1/0) et donc $,/0 - y (n).Le 
i=l 
résultat du chapitre 3 $ ILE permet de recourir aux tables des lois usuelles puisqu’on y a 
établi que 285, /0 X2, . On peut donc déterminer deux valeurs a et b telles que : 


25, 
P(a< <b)=1-a 


et déduire de là l’intervalle de confiance de niveau 1 — @ : 


2$, 28h 
<0 < 


a 


En choisissant des risques symétriques, pour œ = 0,05 on lit dans la table 5 les fractiles 
d’ordres respectifs 0,025 et 0,975 de la loi *2 :a = 9,59 et b = 34,17 d’où l’inter- 
valle 0,67 < 0 < 2,40. 


Exercice n°8 


La log-vraisemblance a pour expression (cf. chap. 3, II, G) : 


InL (x1,...,X1; m) = un (270?) — ÿ_inx; — E » (Inx; — my 
2 i=l 20° 5 


de dérivées : 


ôinL 1 À 
= > (Inx; — m) 
i=l 


om 
42InL n 
Me 


donc l’emv est : 
1 n 
Mn == ÿ_Inx; 
LE 


Or on sait, par définition de la loi log-normale, que InX += N (m,o) donc cet estima- 
teur est sans biais et convergent, de variance : 


o? 
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n 
donc il est aussi efficace puisque /, (m) = —;- Il suit la loi N (m,o/Vn) d’où l’inter- 
valle de niveau 0,95 : 2 


EE 1,96 Lin 196 


soit pour o = 1 etn = 25 : 1,81 < m < 2,59. 


Exercice n°9 
1) On calcule : 


E (X) = A x2dx = 10 


et l’estimateur sans biais est solution de l’équation en 0,X, = 30: soit : 


3: 
Ti = =Xh 
2 


qui est sans biais et convergent d’après la loi des grands nombres. On peut calculer sa 
variance à partir de : 


2 1 
E (x?) = æ Jo xdx = EL 
9. — à : 
d’où V (7,) = : V (X)= av (X) = ——. La question de l’efficacité ne se pose pas 


ici car les hypothèses de M ne sont pas vérifiées, X (62) = [0,0] dépend du 
paramètre à estimer. 


2) La vraisemblance a pour expression : 
2 nn 
L (x1,...,Xn3 0) = (&) I [x pour 0< minx; < max x; < 0 
i=1 


elle est donc nulle pour 0 < max x; et décroissante pour 0 > max x; ce qui montre que 
l’emv est : 


M, = max{X,,...,X,} 


Pour étudier ses propriétés nous devons déterminer sa loi de probabilité : 
n n 
P(My <x) = P Ac =») = J]PG <x) =" G:0) 
i=1 i=1 


en raison de l’indépendance et de l’identité des lois des va. X; de fr. F. La densité 
de M, est donc : 
g(x:0) =nF""(x;0) f (x:0) 
La fr. de X étant définie par : 
0 six <0 
x? 
F (x; 0) = 7 si0<x<0 


1 si0 <x 
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Par conséquent : 


x27—1 : 
g (x: 0) = 2 si0<x<0 
0 sinon 
et : 
EU) 2n [ 2 2n à 
n= X = 
CEUR 2n +1 
L’estimateur sans biais est donc : 
ai 2 1 
CREER 73 
2n 
dont la variance se déduit de : 
2n 2n 
E M2 te 2n+1 7 = 02 
(A) = gue  dx = 
soit : 
” 2n + 1)? 9? 
V (6,) = V (M) = ———— 
2n 2n (2n +2) 


Cet estimateur est donc convergent et infiniment plus efficace que 7, , au sens où : 


v (6,) 2 
= > 0 
V(T) n+1 


3) Nous allons construire un intervalle de confiance à partir de M, dont la loi est connue, 
de f.r. : 
QO six <0 
2n 
Dm si0<x<0 


1 si0 <x 


G (x; 0) = 


Nous cherchons a et b tels que 1—aœ = P(0a < M, <60b) ou tels que 
td = P(M, <60a)=G(0a;0) et a = P(M,; > 0b)—=1—-G(0b;0) avec 
1 + @2 = &, ce qui va définir a et b par: 

G=a",1l—a@ =b" soit a=a" et b=(1- a)?" 


d’où l’intervalle de confiance : 


Application : a = 0,91,b = 0,999 soit l'intervalle 5,00 < 0 < 5,48. 


Exercice n°10 


Les estimateurs sans biais de o? et 0? sont respectivement : 


ne EE 
Of = — X;—-m et Oo, = — Yi —m 
ee > ( ) re È ( ) 
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dont les lois sont données par ñn 10? / FE S x et n202 / 0 vs x . Les deux échantillons 
étant indépendants, on sait (cf. chap. 5, $ IL, B) que (6? / 0!) / (6? / 03) = F(n,n) 


donc l’intervalle de confiance est défini à partir de : 


6? oo? 
1-a=P(a< x <o) 


72 2 
O3 01 
soit : 
RE RE OR M 
X = DÉS Xe 0 
b 5; O3 a ©; 


Exercice n°11 
1) Comme E (X) = V (X) = 0, on peut retenir comme estimateurs sans biais de 0 les 


moments empiriques : 


— TE 1 n _ 
Rio et =) (x -Xx) 


i=1 


Ces deux estimateurs sont aussi convergents, de variances respectives : 


Lt a 40 20? 
V()= et V(S)=S 


Le rapport V (52) /V (X:) tend vers 20 quand n devient infini, valeur inconnue qui ne 
permet pas de comparer ces deux estimateurs. Étudions leur efficacité en écrivant 
d’abord la log-vraisemblance : 


n n 1 À 
InL (x... 25 0) = — 5 In2x — >In0 — = D (x; — 0Ÿ 
puis en dérivant : 
ôInL n 1 = , n 
50 — 252 D» 2 
dnL nn l = ; 
207 202 6 » 
D'où la quantité d’information de Fisher : 
1 @)=E 92InL n F E(X°) 
n = =—| n 
902 202 63 


soit, avec E (x?) = V(X)+ E?(X) = 0 +0? : 
n 


n 
LO= +5 
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On voit ainsi que : 


< 1, (0) < 1, (0) 


1 1 
V (x) V (5) 
donc aucun de ces estimateurs n’est efficace. 


2) Pour construire un intervalle de confiance, nous allons utiliser le fait que (cf. chap. 5, 
III, A) : 


ce qui permet de déterminer les valeurs dea et b telles que : 
r( o) =1l—-a 


55 = 
X,—b <0<X,-a— 


Vr Vr 


Pour & = 0,05 on retient des risques symétriques puisque la loi est symétrique et on lit 
dans la table 6 les fractiles b — —a = 2,064 avec X25 = 2,01 et 525 — 1,42 d’où l’in- 
tervalle : 


d’où l'intervalle : 


1,42 < 0 < 2,59 


Exercice n°12 


1) L'expression de la vraisemblance est : 


2 0 
Eastoe]]r = (5) on- D | 
i=1 


La log-vraisemblance s’écrit : 


In L(x:,...,Xxn; 0) = -nin2+nim9-0 xl 


i=1 
Cette fonction est dérivable pour tout 0 > 0 avec : 


an L n 


et D 


La dérivée s’annule pour 0 = n/ |xi| ; la dérivée seconde est négative : 
i=1 


4? In L n 
202 6? 
L’estimateur du maximum de vraisemblance est donc : 
_ n 


Où = — 
Det 
i=1l 
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Pour étudier les propriétés de cet estimateur nous allons déterminer la loi de U = 601|X1. 
La fonction de répartition est nulle pour u < 0 et définie pour u > 0 par: 


G(u) = P(U <u) = F() -F(-°) 


D'où une densité définie par : 


CETTE 


Il s’agit donc de la loi exponentielle ou loi y (1). Par conséquent $, = 0X27]|X;| suit la loi 
y (n). Un calcul intégral nous permet alors d’obtenir : 


1 1 1 1 
E| — |= et V =_ 
(:) n—l (:) (n — 2)(n — 1)? 


L’estimateur s’écrivant sous la forme 0, = n0/$,, on en déduit : 


n2 


THE D=l) 


E(@)=—"—0 et V(é) 


n — 


2 


Cet estimateur est biaisé, donc il ne peut pas être efficace. Il est asymptotiquement sans 
biais et de variance qui tend vers 0, donc il est convergent. 


2)Ona >, = S,/0 qui suit donc la loi y(n,0) et donc 20Y, suit la loi y(n,1/2) ou loi 
x2, (cf. chapitre 3 $ IL.D et ILE). On en déduit un intervalle de confiance bilatéral pour @ 
par la condition : 


b 
PP A ET A EC 
25, 25, 


a et b étant les fractiles d’ordres respectifs &/2 et 1 — æ/2 de la loi x2,. 


3) On déduit de la question 1 que E(IX|) = 1/0 et V(IXN) = 1/02. L'application du 
théorème central limite à 1/9, permet donc d’obtenir : 


1/0, — 1/0 
De —— NO.D 


En appliquant la propriété II.G du chapitre 6 on en conclut : 


, — 0 
Vn 


— N(0,1) 


loi 


On en déduit un intervalle de confiance bilatéral pour @ par la condition : 


4, —0 
as plu <Vn E <a 


où u est approximé par le fractile d'ordre æ/2 de la loi normale centrée réduite. 
L’intervalle est : 


= = 


ê 6, 
Din M OU Me 0 Dee 2 - re 
Tour  1=u/yñ 


Exercice n°13 


1) La vraisemblance s’écrit : 


n 1 n 
L(x1,...,%n5 0) = (20) " [Lx "exp 0 Nm 
i=1 i=1 
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d’où la log-vraisemblance : 


LL, — 1 
InL (x:1,...,xn; 0) = —nln2 — nln0 — 2m [Lx 2. 2% 


et ses dérivées : n 
dInL n 1 
30 =-5tm2 va 
9?InL LA 


2 n 
TE Din 


1 
La dérivée première s’annule pour 0 = — ) 4/xi avec une dérivée seconde en ce point 
n 2 
i=] 
de valeur —n/0?, donc l’emv est : 


2 1 

0 = — X; 
Pour étudier ses propriétés, nous allons déterminer la loi de la va. Y = VX : 

G(:8)=P(Y<y)= P(VX <y)=P(X <y)=F(y;6) 
pour y > 0. Sa densité est alors définie par : 
15 
80:50) =2yf(756)= 7e" 

donc Y -+ € (1/0) et l’estimateur 6, = Ÿ, est un estimateur sans biais et convergent 
de 0 = E(Y), de variance 0?/n. 
L'information de Fisher se calcule par : 
42InL n  2n 
902 


1, (@)=E ( 
donc 6, est efficace. 


2) Pour construire un intervalle de confiance à partir de 6,, on utilise le fait que 
Y = €E(1/0) = y (1,1/0) donc nd, - y (n,1/0) puis n0,/0 + y (n) et enfin 
(cf. chapitre 3 $ ILD et ILE) 2n0, /0 + Xe . On peut donc trouver deux valeurs a et b 


2n0, 
1—-œ=Pla< F <b 


ce qui permet d’obtenir l’intervalle : 


2n0, 2n0, 
é <0 < s 


telles que : 


a 


Pour & = 0,10 et en prenant des risques symétriques, on lit dans la table 5 : a = 26,51 
et b = 55,76 ; on obtient par ailleurs 00 = 2,37 d’où l'intervalle : 


1,70 < 0 < 3,58 


intervalle très grand en raison de la faible taille de l’échantillon. 
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Exercice n°14 


1) D’après l’exemple 4.13 et la forme de la densité on sait que X et Y suivent des lois 
normales centrées et de variances respectives 1 + 49 et 1 + 0. 

On a de plus Cov(X,Y) = —(1 + 28). 

D’après la définition de la loi normale vectorielle, X + Y suit une loi normale. Cette loi 
est centrée, avec : 


VX +Y) = V(X) + V(Y) +2 Cou(X,Y) = 0 = E(X+Y}Ÿ 


L’estimateur est donc : - 


l 2 
== 206 +») 
2) Cet estimateur est sans biais et convergent d’après la loi des grands nombres. On sait 
également que nT,/0 suit une loi x? et donc V(T,) = 20?/n. Pour savoir s’il est effica- 
ce, nous devons calculer la quantité d’information de Fisher. L'expression de la vrai- 
semblance est : 


AC RAC 
i=1 


n 


EN? 1 : U à 
(5) exp — > [0 + 8)x? + 2(1 + 20)xi y: + (1 + 40)y?] 


i=1 
La log-vraisemblance s’écrit : 


In L(xi,ÿ1,...,Xn, Yns 0) = —n In 27 — 5m Q 
l 2 2 
_ > [A + 9x2 + 201 + 20)xi y: + (1 + 40) y] 
Cette fonction est dérivable pour tout 0 > 0 avec : 


ô In L n 1 À " 
2 26 * 37 22 Ci +5) 


La dérivée seconde est : 


mL n 1 À à 
don op gs 2 Gi +») 


La quantité d’information de Fisher est donc : 


9? nm) n 


1 À n 
= E(X; + Y;} = — 
302 20 * & > CRE Do 


1,(0) = E( 


L’estimateur est donc efficace. 


L’intervalle de confiance bilatéral pour 8 est obtenu par la condition : 


nT, nT, 
Ia = Pa <nn,/0 <b= P [Ÿ < 0 < l 
a 


a et b étant les fractiles d’ordres respectifs &/2 et 1 — &/2 de la loi x?. 


3) L'application du théorème central limite à 7, permet d’obtenir : 


F0 
RS NO 
04/2 loi 
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On en déduit un intervalle de confiance bilatéral _ : par la condition : 


I-a=e| A <") 


où u est approximé par le fractile d’ordre æ/2 de la loi normale centrée réduite. 
L’intervalle est : 


Th Th 
Sr 


Exercice n°15 


1) L'espérance se calcule par : 


+00 1 +00 x — 0 
Ea= x GOdx = | cp | }as 
_ 0 Jo 0 


OO 


On fait alors le changement x — 0 = Ou, puis on intègre par parties : 
+00 pe +00 
F0 =0 | (A+u)e “du =0[-(+ue"*], +0 | e “du = 20 
0 0 


2) L'estimateur 7, de © obtenu par la méthode des moments est solution de l'équation 
en 0 : 


L—= 
Il s'agit donc de 7, = 5e r. Il est sans biais par construction : 


=> 1 
E(T;) = 5£ (&) = 5 @ = 0 


Il est convergent d'après la loi des grands nombres : 
X,— E(X) = 20 
P 


Donc : 


LT = 1 
DER ES CEUX 0 
2 p 2 


La question de l'efficacité ne se pose pas puisque X prend ses valeurs dans l'intervalle 
[0 ,+ool[ qui dépend de 8. 


3) D'après le théorème central-limite : 


On doit calculer la variance de X : 


+00 … 
E(x)=; | exp (2) x 


250 e STATISTIQUE ET PROBABILITÉS 


© Dunod. Toute reproduction non autorisée est un délit. 


On fait alors le changement x — 0 = Ou puis on intègre par parties : 


+00 
ECXY= e | (1+u)?e “du 
0 


+00 


+00 
= [-(+uÿe"T, + 2 | (1+u)e “du 
0 
= 02 +20E (X) = 50? 


Ainsi, V (X) = 0? et on obtient : 


X, — 20 — 0 
Vn © N (0,1) 


CS 9/2 


L'estimateur 7, suit asymptotiquement la loi normale N (o ) . On construit donc 


Q 
2/n 
un intervalle de confiance bilatéral symétrique, puisque cette loi est symétrique. On peut 
trouver la valeur approchée de la constante u telle que : 


T, — 0 
ia = P(-u < Vi 672 <u) 


L'intervalle de confiance est alors défini par : 


D Shane 
ET < = 
2/n 2/n 


Ce qui est équivalent à : 
Th e Th 
— < O0 < ———— 
1+u/2/n 1—u/2/n 


a 
où u est approximé par le fractile d'ordre 1 — 3 de la loi normale standard N (0,1). 


Pour 1 —@œ— 0,95 on retient la valeur approchée u = 2; pour cet échantillon 
too = 3,3 d'où l'intervalle 3 < 0 < 3,67. 
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ests 
d'hypothèses 


n appelle théorie des tests la seconde branche de la statistique 

mathématique, celle qui permet de confronter deux hypothèses 

retenues a priori. Comme dans le cadre d'un problème d'estima- 
tion, on retient un modèle statistique où la v.a. X suit une loi de proba- 
bilité P;, qui dépend d'un paramètre 8 inconnu. On dispose cependant ici 
d'informations supplémentaires qui font penser a priori que la valeur de 
ce paramètre est égale à une valeur fixée 9, et on cherche à valider (à tes- 
ter) cette hypothèse, au vu d'un échantillon de la loi de X. Cette hypo- 
thèse qui est privilégiée, parce qu'elle paraît la plus vraisemblable a prio- 
ri, est appelée hypothèse nulle et notée H,. Construire un test va consis- 
ter à partitionner l'ensemble R" des réalisations possibles du r-échan- 
tillon en deux régions, celle où l'on décidera d'accepter H,, et celle où 
l'on décidera de la rejeter, qui se nommera région critique du test. Pour 
délimiter ces deux régions, on fixe a priori une valeur (faible) à la proba- 
bilité de l'erreur qui consiste à décider, au vu de l'échantillon, de rejeter 
l'hypothèse nulle alors que celle-ci est vérifiée. Cette probabilité se nom- 
me risque de première espèce et sa valeur standard est de 5 %. Lorsque 
le paramètre 9 ne peut prendre que deux valeurs distinctes 6, et 4, c'est 
le théorème de Neyman et Pearson qui permet de déterminer la forme 
de la région critique, à partir du rapport des vraisemblances associées à 
chacune des deux valeurs possibles du paramètre. Dans le cas où on peut 
attribuer des probabilités a priori à ces deux valeurs, ainsi que des coûts 
d'erreur, on utilise la méthode de Bayes. 


Objectif du chapitre : montrer comment, à partir d'observations indépen- 
dantes d'un phénomène, considéré comme aléatoire, on peut 
choisir entre deux hypothèses relatives à la valeur du paramètre 
qui caractérise la loi retenue dans le modèle. 

Concepts clés étudiés : règle de décision, hypothèse nulle, hypothèse alter- 
native, région critique, risque de première espèce, puissance, 
méthode de Bayes, méthode de Neyman et Pearson, test UPP, 
test du khi-deux. 
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Concepts principaux en théorie des tests 


Dans le chapitre précédent, nous avons retenu un modèle statistique paramé- 
trique pour décrire de façon simplifiée, mais théorique, un certain phénomène 
réel. Les valeurs observées, liées à ce phénomène, sont alors considérées comme 
des réalisations d’une variable aléatoire dont la loi est inconnue, mais appartient 
à une famille donnée. Cette loi est totalement spécifiée par la connaissance d’un 
nombre réel 6, appelé paramètre, et qui permet de repérer précisément l’élément 
de cette famille de lois. La théorie de l’estimation fournit les outils permettant 
de se faire une idée de la valeur numérique de ce paramètre. 


Ici, la théorie des tests va être un outil d’aide à la décision. Dans le cadre du 
même modèle, on dispose cette fois de plus d’informations a priori sur le para- 
mètre. Ces informations se traduisent par deux hypothèses seulement sur les 
valeurs possibles du paramètre. En fonction des observations, on devra choisir 
l’une de ces deux hypothèses. Nous allons montrer, à partir d’un exemple, com- 
ment on peut se fixer une règle de décision entre ces deux hypothèses. 


Le ministre de l'Économie et des Finances s’interroge pour savoir s’il doit 
prendre des mesures de relance de l’économie. Sa décision va être fondée sur les 
observations de l’accroissement mensuel de l’indice de la production indus- 
trielle. Cet accroissement est mesuré par l’ Insee avec une certaine incertitude, ce 
qui amène à le considérer comme une v.a. / de loi normale, de moyenne m, et 
d’écart type connu o = 0,2%. Dans la période antérieure, le paramètre m avait 
pour valeur m = 0,5%. En période de récession, on considère que ce paramètre 
prend la valeur m =0,3%. Pour faire un choix entre ces deux valeurs, le 
ministre attend de disposer des valeurs de 7 pour le dernier trimestre. Inquiet de 
l’effet de mesures de relance sur l'inflation, il se fixe a priori la règle de déci- 
sion suivante : si la moyenne des accroissements du trimestre est inférieure à 
0,35 % alors je prends des mesures de relance. On peut alors se poser les ques- 
tions suivantes : est-il possible de mesurer les risques associés à cette règle arbi- 
traire ? peut-on fixer à l’aide de critères objectifs un autre seuil que la valeur 
retenue de 0,35 % ? 


Le modèle statistique va nous permettre de répondre et d’associer des éva- 
luations numériques à cette règle de décision. La v.a. 7 appartient ici à la famille 
des lois normales, d’écart type connu o = 0,2. L'autre paramètre de cette loi, la 
moyenne 7", est inconnu, mais ne peut prendre ici que deux valeurs. Il s’agit 
donc de faire un choix entre les deux hypothèses : 

Ho : 1 N (0,3; 0,2) 
H;:1--N (0,5; 0,2) 


Chacune de ces hypothèses a pour conséquence une décision qui lui est asso- 
ciée : 
— D, : prendre des mesures de relance de l’économie ; 


— D, : ne rien faire. 
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Cette décision va être prise au vu d’un échantillon (J,,1,,1;) de cette va. 7 
observée au cours du dernier trimestre. La règle de décision retenue par le 
ministre se formalise alors de la façon suivante : 


si (L+L+B) <k on décide Do 


si B+L+B)>k on décide D, 


La valeur de k, appelé seuil critique, est fixée arbitrairement ici à k = 0,35. 
Chacune de ces décisions a pour conséquence une erreur éventuelle : 


— relancer l’économie (D,) en période d'expansion (4) et favoriser ainsi 
l'inflation ; 
— ne rien faire (D) en période de récession (Hi) et accroître le chômage. 


Le modèle statistique retenu permet alors de calculer les probabilités asso- 
ciées à ces deux erreurs. Par exemple : 


1 3 
a = P (ne rien faire|m = 0,3) = P (D; |Ho) = PO >kIH) 
j=1 


0,2 
Sous l'hypothèse H5, la loi de 7 = D 1; est la loi normale N (o 3; ==). 


On peut donc calculer la probabilité précédente en utilisant une v.a. U de loi 


N (0,1) : 
: T-03 Dis 
= P(1>035|H \=P 
pi (> im) (re si ) 


= P(U > 0,43) = 0.33 


De même, l’autre risque d’erreur se calcule par : 
B = P (relancer|m = 0,5) = P (DolHi) = P(I <k|H) 
: r( = Le _ 0,15 
= Koae -00 


4/3], ) = P(U < —1,30) = 0,097 


Ces deux risques ne sont donc pas équivalents, le premier étant trois fois 
supérieur au second. Cette règle correspond donc bien à un souhait de se garan- 
tir avant tout contre l’inflation. Si on veut que le seuil ne soit pas fixé arbitrai- 
rement, c’est par le choix d’une valeur de risque que l’on en déduira alors une 
valeur de seuil critique. Si on souhaite plutôt se prémunir prioritairement contre 
le chômage, on fixe une valeur faible au risque «, par exemple &« = 5%. Il va en 
découler une valeur du seuil £ par la condition : 
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On obtient ainsi : 


k— 0,3 
0,2/V3 


à 
1,649 soit &=0,3+ U21,6449 = 0,49 
V3 


L'autre risque a alors pour valeur : 


0,49 — 0,5 


= P(T<k|H)=PIU < =————— 
| RIRES) CS 


) = P(U < —0,09) = 0,4641 


Le risque de relancer à tort est cette fois très élevé. Pour une décision où ce 
risque serait considéré comme le plus dommageable, il faudrait fixer le seuil k 
par la condition : 


k—0,5 
B = 0,05 — P (relancer Im = 0,5) = P (u < ) 
0,2/V3 


On obtient alors comme valeur : 


0,2 


k = 0,5 — —=1,6449 = 0,31 
V3 


La règle de décision, déterminée par le seuil, est fortement dépendante du 
risque contre lequel on souhaite se prémunir en priorité. 


Cet exemple introductif va nous permettre de formaliser un problème géné- 
ral de test. On considère un modèle statistique où la loi de probabilité P, de la 
v.a. X dépend d’un paramètre inconnu 6 qui varie dans un sous-ensemble donné 
@ de R. On suppose que cet ensemble est partitionné en deux sous-ensembles 
donnés ®, et ®,, auxquels vont être associées les deux hypothèses notées 
H, : 0 E ®, et H, : 0 € O,. Construire un test consiste à définir une règle de 
décision qui va associer une décision à un échantillon observé (X1,...,X,) de 
la loi de X, les deux décisions possibles étant D, : accepter H,, et D; : accepter 
Hi. À chaque décision correspond une région de R”, qui va donc être partition- 


né en deux sous-ensembles W et W, c’est-à-dire que si la réalisation de l’échan- 
tillon est un point (x1,...,x,) de W on décide D, donc on rejette A. Dans le 


cas contraire, c’est-à-dire pour un point de W, on décide D,, donc on accepte 
Ho. 
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Définition 
La région W de rejet de l’hypothèse nulle A, se nomme région critique du 
test et la région W région d'acceptation. 


La construction d’un test va donc consister à déterminer cette région critique. 
La méthode pour l’obtenir dépendra des conséquences que l’on attribue à cha- 
cune des deux erreurs qui sont associées aux deux décisions possibles. Ces 
erreurs sont les suivantes. 


Définition 


L'erreur de première espèce consiste à décider D, alors que Æ, est vraie, 
soit rejeter à tort l'hypothèse nulle Æ,. L'erreur de seconde espèce consiste à 
décider D, alors que AH est vraie, soit accepter à tort l'hypothèse nulle Æ. 


Nous allons présenter deux méthodes de construction d’un test, basées sur 
des principes très différents. La méthode de Bayes est utilisée lorsqu’on dispo- 
se encore plus d'informations a priori sur les hypothèses, permettant de leur 
attribuer une probabilité a priori, et lorsque l’on peut en plus quantifier le coût 
de chaque décision en fonction de l’hypothèse effectivement réalisée. 


éthode de Bayes 


On se place dans le cas où on a attribué des probabilités a priori po et 
Pi = 1 — po à chacune des hypothèses respectives H, et H; et que l’on a égale- 
ment associé un coût à chaque décision, en fonction de l’hypothèse qui est effec- 
tivement réalisée. Le tableau ci-après contient ces coûts, la décision prise figu- 
rant en colonne et l'hypothèse vraie en ligne : 


Do D; 
H5(Po) Coo Coi 
H;(p1) Cio Cu 
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Une bonne décision peut avoir également un coût et donc on aura générale- 
ment Co > Det Ci > 0. 


Après la réalisation (x1,...,x,) on peut calculer, à l’aide du théorème de 
Bayes, les probabilités a posteriori x, et x, des hypothèses A, et H : 


PoLo PiLi 
To = ————— € M = ———— 
PoLo + piLi PoLo + piLi 
où on a noté L,, la valeur de la vraisemblance L (x:,...,x,; 0), quand 0 € @,, 


et L,, quand 9 € @;. On peut alors calculer les espérances du coût de chaque 
décision pour cette distribution a posteriori : 


ETC (Do)] = Como + Com et ETC (D:)] = Coixo + Cum 


La règle de décision de Bayes consiste à associer à l’observation (x,,...,x,) la 
décision dont l’espérance de coût est la plus faible. 


Exemple 8.1 


Nous allons reprendre l'exemple introductif en supposant cette fois que 
les informations disponibles permettent d'attribuer la probabilité 
Po = 0,6 à l'hypothèse d’entrée dans une période de récession, qui se tra- 
duit par m = 0,3. On considère de plus qu’une bonne décision est sans 
coût, soit Copy = Ci = 0, et que le coût de relance à tort est trois fois plus 
élevé que celui de ne rien faire en période de récession, soit Cio = 3Coi. 
Dans ces conditions, les espérances du coût de chaque décision sont : 


ETC (Do)] = Com = 3Coum et E[C(D:)] = Como 
On a donc : 
ETC (D))] < EC) = 3m < 


= 3pili < polo > SE < — 
Po 1 L; 


L'expression de la vraisemblance est ici : 


1 
L (x:,%2,%3; m) = (=) sv 29? RD — m) 


Le rapport des vraisemblances est donc : 


L RS 
= exp — > lé — mo) — (x — m) | 


i=1 
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La décision D, a donc le coût le plus faible si : 


3 


1 
In2 < 302 D [Ci = mo) — (x — mi) |] 


i=1 
Mo — M Ë 
In2 < or D — 3 (mo + mi) 


La règle de Bayes consiste donc à choisir la décision D, dans le cas où : 
In2 <6— Sn Ds < Le = 0,353 


On retrouve la même règle de décision avec le même seuil critique arron- 
di qui avait été fixé à la valeur k = 0,35. 


éthode de Neyman et Pearson 


rincipe de la règle de Neyman et Pearson 


On privilégie l’une des deux hypothèses, par exemple celle que l’on considère 
comme la plus vraisemblable, et on la choisit comme hypothèse nulle H,. Cette 
hypothèse sera celle dont le rejet à tort est le plus préjudiciable. L’autre hypo- 
thèse H est l’hypothèse alternative. Il n’y a donc pas de symétrie entre ces deux 
hypothèses. L'hypothèse Æ, est privilégiée et il faut des observations très éloi- 
gnées de cette hypothèse pour la rejeter. 


Définition 
On appelle risque de première espèce la probabilité de rejeter à tort l’hypo- 
thèse nulle, soit : 

oœ = Py(DilHo) = Ps (HilHo) = P; (W10 € Go) 
On appelle risque de seconde espèce la probabilité d’accepter à tort l’hypo- 
thèse nulle, soit : 


B = P, (DolAi) = P, (HolHi) = Ps (Wie € :) 
L'erreur la plus grave consistant à rejeter à tort l’hypothèse nulle, la méthode de 
Neyman et Pearson fixe une valeur maximum @, au risque de première espèce. 


Le test est alors déterminé par la recherche de la règle qui minimise l’autre 
risque, celui de seconde espèce. 
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Définition 


On appelle puissance d’un test la probabilité de refuser Æ, avec raison, c’est- 
à-dire lorsque A, est vérifiée, soit : 


n = P, (D;|4;) = P, (H|H:) = P,(WI0 e 8) = 1-8 


La règle de décision de Neyman et Pearson consiste à déterminer la région 
critique W pour laquelle la puissance est maximum, sous la contrainte & < œo. 
Le choix de la valeur de , peut être déterminant quant à la conclusion tirée au 
vu d’un échantillon. La valeur standard retenue est æo — 0,05. Choisir une 
valeur plus faible (par exemple «5 = 0,01) conduit à exiger des contre-preuves 
très fortes pour rejeter H;, qui est ainsi admise a priori. Choisir une valeur plus 
forte (par exemple & = 0,10) signifie que l’on est moins convaincu a priori de 
la validité de A, et que l’on est prêt plus facilement à la rejeter au vu des obser- 
vations. 


ypothèses simples 


Une hypothèse est qualifiée de simple si la loi de la v.a. X est totalement spéci- 
fiée quand cette hypothèse est réalisée. Dans le cas contraire elle est dite mul- 
tiple. Nous allons examiner le cas où le paramètre © ne peut prendre que deux 
valeurs 6 et 6,, ce qui correspond au choix entre les deux hypothèses simples 
suivantes : 


re 
H, :0 —=06, 


Même si cette situation est peu fréquente dans la réalité, de nombreux autres 
cas peuvent être résolus à partir de ce cas élémentaire. La forme de la région 
critique est alors déterminée par le théorème suivant. 


Théorème de Neyman et Pearson 
Pour un risque de première espèce fixé à , le test de puissance maximum 
entre les hypothèses simples ci-dessus est défini par la région critique : 


Lo Co: --v2n) 4) 


W = C7 JE) 


où la valeur de la constante k est déterminée par le risque fixé 


do — Py (WI0—6), ayant posé Lo (x... ,x3) = L (x... ,x35 60) 
et L, (x:,. 09 ,Xn) ue (x. 20h50 6) ù 
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Exemple 8.2 


Nous allons appliquer ce théorème au cas de la loi exponentielle de para- 


1 
mètre ni avec 0, > 09. La vraisemblance a pour expression : 


LC px 0) = exp nn. 


avec x; > 0,1 <i < n. Le rapport des vraisemblances est donc : 
L TX CS 1 1 7 
o (Xi = (à) sé G-3)2 
Li (x1,...,Xn) 60 CA 0 i=1 


La région critique est donc définie par la condition : 


Cette condition est équivalente à : 
1 1\ 
exp C — à) dx < ki 
GG} 


En prenant le logarithme, on obtient comme nouvelle condition équiva- 
lente : 


Puisque 0, > 0, on arrive à la condition : 
n 
De” > C 
i=1 


La valeur de la constante C, qui va totalement préciser la région cri- 
tique, est déterminée par la condition : 


%=PIS X; >Cl0=6@ 


Dans l'exercice 7.7 nous avons établi que 2S,/0 suivait une loi du khi- 
n 
deux à 2n degrés de liberté, avec S, = >. X;. La condition précédente 


i=I 
se réécrit donc sous la forme : 
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C 
La valeur de 2— est donc celle du fractile d'ordre 1 — « de la loi du khi- 
0 


deux à 2n degrés de liberté. La puissance de ce test peut ensuite se cal- 
culer par : 


1 


F or c 
nr [x cine)? ff 28) 


ypothèses multiples 


Nous allons d’abord considérer le cas d’une hypothèse simple contre une hypo- 
thèse multiple de l’une des formes suivantes : 
ou Er 
H :0>0 H, :0<6, 


On détermine au préalable, par la méthode de Neyman et Pearson, la région 
critique W du test suivant : 
Ho : 0 — 6 
H 1: 0 — CA 


où 6, est une valeur fixée quelconque, mais vérifiant l'hypothèse alternative A. 
S1 la région W obtenue pour ce test entre hypothèses simples ne dépend pas de 
la valeur choisie 6, alors on aura obtenu un test uniformément le plus puissant 
(UPP) pour le problème de test initial. Cela signifie que pour toute autre région 
critique W’ on aura P, (W]0 e @:) > P,(W'10 € @:) pour tout 8 de ®:. 


Exemple 8.3 

Si nous reprenons l'exemple 8.2, la région critique dépendait de la condi- 
tion 0, > 6, mais pas de la valeur précise 0,. La région critique obtenue 
est donc aussi celle du test UPP de H, : 0 = 6 contre H; :0 > 6. 
Cependant, on ne peut pas cette fois calculer la puissance de ce test 
puisque la valeur du paramètre n’est pas connue dans l'hypothèse alter- 
native. On peut seulement définir une fonction puissance de ce paramètre 
par : 


nw=rx>cu-a 
i=1 


Pour le problème de test suivant : 


H :0 = 6 
H:046 
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il n'existe pas de test UPP. La région critique W de ce test s’obtient par 


réunion des régions critiques W; et W; des deux tests précédents, pour le 


À : * ,  &0 
même risque de première espèce 5: 


Exemple 8.4 
Dans l’exemple précédent, la région critique W,; obtenue était l’ensemble 
des points (xX1,...,x,) tels que : 

S, > C 


C 
avec 2 qui est le fractile d'ordre 1 — F de la loi du khi-deux à 2n 
0 


degrés de liberté. De même, pour le test de H, : 0 = 6, contre H\ :0 <& 
la région critique W; obtenue est définie par : 


Sy < C2 


C 
avec 2. qui est le fractile d’ordre _ de la loi du khi-deux à 2n degrés 
0 


de liberté. La région critique de H:0 —=6, contre H; :0 Æ 6 est 
W=W U W,. Il est plus facile de définir ici la région d'acceptation de 
l’hypothèse nulle par la condition : 


CO <S, < Ci 


Pour le problème de test suivant : 


H : 0 < 6 
H; :0> CA : 
on suppose que la loi P, est à rapport des vraisemblances monotone. Cela signi- 
fie qu’il existe une statistique T, = T, (x:,...,x,) telle que le rapport des vrai- 
semblances : 

L (x, Xp; 0) 

L (XL: sons 0") 


s'exprime comme une fonction croissante de 7, pour toutes les valeurs de 0 et 0” 
qui vérifient l'inégalité 0 > 0’. Dans ces conditions, on utilise le théorème suivant. 


Théorème de Lehmann 
Il existe un un test UPP dont la région critique W est l’ensemble des points 
(x1,...,x,) tels que : 
Trier) 


où la valeur de la constante k est déterminée par le risque fixé 
oo = Py (W]10 = 6). 
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Exemple 8.5 


Dans l’exemple 8.2, nous avons obtenu comme rapport des vraisem- 


blances : 
L:(K:.,:4::3%:: 0 9'\" 0-0 © 
(x X ) _ exp — Jx 
L'(x:,...,x,; 0) 0 CLR 


Pour toutes les valeurs de 0 et 0’ qui vérifient l'inégalité 0 > 0”, c’est une 


n 
fonction croissante de T, — >. x;. Donc, par application du théorème de 
i=I 
Lehmann pour H : 0 < @ contre Hi : 0 > 6, le test UPP a pour région 
critique l’ensemble des points (x;,...,x,) tels que : 


La constante k est déterminée par la condition : 


x > k|0 = 06 
i=I 


est d'indépendance du khi-deux 


Pour tester l’indépendance de deux caractères X et Y, qualitatifs ou quantitatifs 
(répartis alors en classes), à respectivement r et s modalités, on relève le nombre 


F s 
n;; d'individus d’une population de taille n — ÿ: D ni; Qui possèdent simulta- 
i=l j=1 
nément la modalité i,1 <i <r, du caractère X et la modalité j,1 < j <s, du 
caratère Y. Soit p;; la probabilité théorique correspondante, pour un  : tiré 
au hasard dans la population, de posséder simultanément ces deux modalités à 


S$ Fr 
et j. Les probabilités marginales sont p; = > Di; EP; = > Pi;. L'indépen- 
j = i=1 
dance de ces deux caractères se traduit par l’hypothèse nulle 
Hi : pi; = pi X p;. Pour tester cette hypothèse contre l’alternative 
Hi: p;; # pi X p,;, on utilise la statistique : 


re me CDD 


i=1 j=1 i=l j=1 
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Sa loi asymptotique, sous A,, est la loi du khi-deux à (r — 1) (s — 1) degrés 


S 
de liberté. On a noté n;, — don; etn; 
j=l 


Fr 
= > ni; les effectifs marginaux. 


i=1 


La région critique de ce test est de la forme : 


D, 


>C 


Pour un risque de première espèce &« = P (D, > C|Hi), la valeur de C est 


approximée par le fractile d’ordre 1 — & de la loi x£_,,,_1, 


Exemple 8.6 

Pour comparer l'efficacité de deux médicaments semblables, mais de prix 
très différents, la Sécurité sociale a effectué une enquête sur les guérisons 
obtenues avec ces deux traitements. Les résultats sont présentés dans le 


tableau suivant : 


Médicament cher Médicament bon marché 
Guérisons 156 44 200 
Non-guérisons 44 6 50 
200 50 250 


On calcule la valeur de la statistique : 


D, = 250 ( 


156? 


4.10* 


44 6? 
pi 1) = 2,5 


10% 25.10? 


Pour un risque de première espèce à = 0,05 le fractile d'ordre 1 — & de 
la loi x? a pour valeur C = 3,84. Puisque la valeur observée de la sta- 
tistique D, est inférieure, on accepte l'hypothèse nulle d'indépendance du 
taux de guérison et du coût du médicament. 


À retenir 


En dehors du cas particulier où on se donne une loi de probabilité 


a priori sur les valeurs du paramètre et où on utilise la méthode de Bayes, 
c’est la méthode de Neyman et Pearson qui est utlisée pour effectuer un test 
d’hypothèses. Le théorème de Neyman et Pearson fournit l’outil essentiel 
pour bâtir un test, c’est-à-dire définir la région où on va rejeter l’hypothèse 
nulle retenue. Il est bien entendu essentiel de connaître les définitions pré- 
cises des différents concepts intervenant dans les tests statistiques. Notons 
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que les deux hypothèses à confronter ne sont pas équivalentes et que l’hy- 
pothèse nulle est privilégiée, étant choisie comme celle dont le rejet à tort 
est le plus préjudiciable. Notons enfin l’importance du choix de la valeur du 
risque de première espèce, dont peut dépendre la conclusion tirée d’un 
échantillon donné. 


Compléments 


Construire un test consiste à établir une règle de décision, c’est-à-dire une application @ 
de R” dans {0,1}. Pour toute réalisation (x1,...,x,) de l'échantillon telle que 
D (X1,...,Xn) = 1 on rejette l'hypothèse H5. Pour toute réalisation (x1,...,x,) de 
l'échantillon telle que D (x1,...,x,) = 0 on accepte l’hypothèse A5. La fonction de test 
@ est donc la fonction indicatrice de la région critique W : d = 1w. Pour un test entre 
deux hypothèses simples Ho : 0 = 6, contre H; : 0 = 6, le risque de première espèce 
esta = Ep, [D (X1,...,X,)] et la puissance n — Eo, [g (X1,...,X,)]. 


Quand @ est à valeurs dans {0,1} le test est dit pur ou déterministe. Dans le cas d’une 
loi discrète il n’est pas toujours possible de trouver une région critique W de probabilité 
exacte œ. Dans ce cas, si on souhaite que le risque de première espèce soit exactement 
égal à «, il faut utiliser un test mixte. La fonction @ est cette fois à valeurs dans [0,1] et 
on accepte toujours H; pour ® = 1 et Ho pour = 0. Pour = p € ]0,1[ on effectue 
un tirage au sort où on accepte l’hypothèse A; avec une probabilité p. 


En présence d’hypothèses multiples Ho : 0 € 9 contre H, : 0 € ®;, le risque de 
première espèce est une fonction de 0 définie par & = E9 (@) pour 0 € @o. On définit 
alors la faille t du test par : 


T = sup E, (d) 
0€®0 


Le test est dit de niveau & si T < @. La puissance du test est la fonction de @ défi- 
nie par 7 = Eo (®) pour 0 € O1. Le graphe de la fonction définie pour tout 4 de © par 
@ (0) = 1 — E; (@) s’appelle courbe d'efficacité. 


Un test ® de niveau & est dit uniformément plus puissant qu’un autre test D’ de même 
niveau @ si, pour tout 0 € ® on a Es (D) > Eo (9) ; 


Un test de niveau «& est dit sans biais si, pour tout 0 € ®, on a Eo (@) > @. 


La famille exponentielle à un paramètre dont la densité s’écrit sous la forme : 
f (x: 0) = a(8)b(x)expla (8)T (x)] 
est à rapport des vraisemblances monotone si la fonction & est une fonction monotone 


n 
du paramètre 0. Si æ est croissante, on retient la statistique 7, = T (x;), etsi æ est 


i=1 


n 
décroissante, on retient la statistique 7, = — > T (x). 


i=1 
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Exercices 


noncés 


Exercice n°1 


Une machine produit des pièces dont une proportion présente des défauts qui condui- 
sent à classer ces pièces en second choix. En cas de bon fonctionnement la valeur est 
0 = 0,1. Si la machine se dérègle, la valeur passe à 0 = 0,2. On estime que la proba- 
bilité que la machine soit bien réglée est po = 0,6. On peut souscrire un contrat d’en- 
tretien qui permet de maintenir la machine bien réglée. Le coût est de 0,4 euros par pièce 
produite. Chaque pièce de second choix est vendue 6 euros de moins que les autres. 
Après contrôle des 100 premières pièces produites, on constate que 13 d’entre elles doi- 
vent être classées en second choix. Quelle décision est-on conduit à prendre si on utilise 
la méthode de Bayes ? 


Exercice n°2 


On dispose d’un échantillon (X,,...,X,) d’une v.a. X qui suit une loi normale d’espé- 
rance inconnue m et d’écart type connu o = 1 pour choisir entre les deux hypothèses : 


H, :m=l 
H :m=1,5 


Déterminer la région critique du test de Neyman et Pearson et calculer sa puissance dans 
le cas où n = 25 et = 0,05. Quelle devrait être la taille d’échantillon minimum pour 
que cette puissance soit supérieure à 0,90 ? 


Exercice n°3 


On dispose d’un échantillon (X:,...,X,) d’une va. X qui suit une loi normale centrée, 
d’écart type inconnu o pour choisir entre les deux hypothèses : 


H :0 =1 
H,:0 =2 


Déterminer la région critique du test de Neyman et Pearson et calculer sa puissance dans 
le cas où n = 15 et œ = 0,05. 


Exercice n°4 


Le revenu annuel des individus d’une population est distribué selon une loi de Pareto de 
densité : 


0 ; 
Del El 
0 sinon 
On dispose d’un échantillon (X:,...,X,) de cette loi pour choisir entre les deux hypo- 


thèses : 
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Déterminer la région critique du test de Neyman et Pearson et calculer sa puissance dans 
le cas où n7 = 400 et œ = 0,05. 


Exercice n°5 


Soit X une variable aléatoire dont la densité a pour expression, pour x > À : 


1 x — À 
OPEL | 2 ) 


et nulle sinon, où Ô et À sont deux paramètres strictement positifs. 


1) Déterminer l'estimateur Ân du paramètre À par la méthode du maximum de vraisem- 
blance construit à partir d'un échantillon (X:,...,X,) de X et étudier ses propriétés. 


2) Déterminer l'estimateur 6, du paramètre © par la méthode du maximum de vraisem- 
blance et étudier ses propriétés. Déterminer sa loi asymptotique. 
3) Déterminer la région critique du test : 


Hi : À = 2 
H :ÀA=À 


pour un risque de première espèce donné &, sachant que À, > Ào. Déterminer le risque 
de seconde espèce B et la puissance 7. 
4) Déterminer la région critique du test : 

Ho “0 — ON 

H L= Ê= 6; 
pour un risque de première espèce donné «, sachant que 0, > 65. Pour déterminer 
approximativement le seuil critique de ce test on utilisera l'estimateur À, et la loi asymp- 
totique de ô,. Calculer de la même façon une valeur approchée de la puissance de ce test. 
5) Déterminer la région critique du test : 

Ho : 0 — 6 

H 1: 0 Æ % 
Ce test est-il UPP ? Peut-on calculer sa puissance ? 
6) Déterminer la région critique du test : 


H : 0 < 6 
H :0>60 


Appliquer le théorème de Lehmann pour établir que ce test est UPP de niveau &. Montrer 
que le risque de première espèce «& est une fonction croissante de 9 qui est maximum 
pour 0 = 6. 
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Exercice n°6 


On dispose d’un échantillon de taille n = 15 d’une v.a. de loi normale centrée et de 


variance à pour choisir entre les deux hypothèses : 


H:0=1 
H,:0>1 


Déterminer la région critique d’un test UPP de risque de première espèce & et préciser 
sa fonction puissance. Calculer cette puissance dans le cas où n = 15, pour 0 = 3 et 


a = 0,05. 


Exercice n°7 

Le poids indiqué par une balance, lorsqu’on effectue la pesée d’un poids étalonné à 
100 g, est une v.a. de loi normale d’espérance 100. Si la balance est bien réglée, l’écart 
type a pour valeur & = 5 et sinon cette valeur est inconnue, avec o& > 5. Déterminer la 
région critique d’un test UPP de risque de première espèce & = 0,05 basé sur un échan- 
tillon de n = 10 pesées et préciser sa fonction puissance. 


Exercice n°8 
Le nombre de pannes mensuelles d’un ascenceur est une v.a. qui suit une loi de Poisson 
de paramètre À = 2. Après avoir souscrit un contrat d’entretien, on pense que la valeur 
du paramètre doit diminuer. Préciser la règle de décision à l’issue de six mois de contrat. 
Exercice n°9 


On dispose d’un échantillon (X1,...,X,) d’une v.a. X qui suit une loi normale d’espé- 
rance inconnue m et d’écart type connu o = 1 pour choisir entre les deux hypothèses : 


H :m>3 


Déterminer la région critique du test le plus puissant de niveau & = 0,05 dans le cas où 
n = 100 et préciser sa fonction puissance. 


E 


Exercice n°10 


On dispose d’un échantillon de taille ñn — 12 d’une v.a. X qui suit une loi normale d’es- 
pérance inconnue 7 et d’écart type inconnu © pour choisir entre les deux hypothèses : 


H :m<6 
H :m>6 


Déterminer la région critique d’un test de niveau & = 0,05. Peut-on déterminer sa fonc- 
tion puissance ? 


Exercice n°11 


La durée de vie d’un certain matériel est une v.a. X qui suit une loi de Weïbull de densité : 


l Vi\ 
f (x: 0) = 5x (-À) six > 0 


0 sinon 
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On dispose d’un échantillon (X1,...,X,) de cette loi pour choisir entre les deux hypothèses : 


H:0<1 
H,:0>1 


Déterminer la région critique du test le plus puissant de niveau & = 0,01 dans le cas où 
n = 15 et préciser sa fonction puissance. 


Exercice n°12 

Pour sa fabrication, un industriel utilise des machines de deux constructeurs différents. 
Après six mois d'utilisation, il constate que sur les 80 machines de type A, 50 ne sont 
jamais tombées en panne, alors que pour le type B la proportion est de 40 sur 60. Peut- 
on considérer que ces deux types de machines sont équivalents ? 


Exercice n°13 

Deux séries d’observations effectuées à des dates différentes, sur des échantillons de tailles 
respectives 71 = 41 etn2 = 61, ont conduit à des valeurs respectives de moyennes empi- 
riques et d’écarts types empiriques X = 785,5, = 1,68,y = 788 ets, = 1,40. Peut-on 
considérer que ces deux échantillons proviennent de la même loi normale ? 


Exercice n°14 


Le tableau ci-après donne la répartition par taille, en cm, de 2700 salariés français, de 
sexe masculin, par catégories socio-professionnelles (CSP) : 


Ouvriers Employés Cadres Total 

Moins de 165 cm 325 66 22 413 

De 165 à moins de 170 cm 488 110 51 649 
De 170 à moins de 175 cm 636 158 123 917 
175 cm et plus 451 146 124 721 

Total 1900 480 320 2700 


Au vu de ce tableau, peut-on considérer que la taille est indépendante de la CSP ? 


orrigés 


Exercice n°1 


Nous allons formaliser le problème en construisant le modèle statistique. Nous allons 
introduire une variable indicatrice qui prend la valeur 1 si la pièce produite est de second 
choix. C’est une variable de Bernoulli définie par : 


x = 1 si second choix (4) 
0 sinon (1 — 6) 


Nous sommes en présence de deux hypothèses, Ho : 0 = 0,1 avec une probabilité 
a priori po = 0,6 et Hi : 0 — 0,2 avec une probabilité p; = 1 — po = 0,4. Nous 
devons choisir entre la décision D, de ne pas souscrire le contrat d’entretien et la déci- 
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sion D, de le souscrire. Le coût moyen par pièce produite associé à la décision Do est 
de 60, qui correspond au manque à gagner, car 0 représente la valeur moyenne de X. Si 
on prend la décision D, de souscrire le contrat d’entretien, le coût est de 0,4 par pièce, 
plus le manque à gagner de 6 X 0,1 puisque la proportion de second choix est alors tou- 
jours de 10 %. Tout ceci est résumé dans le tableau de coûts suivant : 


D, D; Probabilité a priori 


H :0 =0,1 0,6 1 0,6 
H, :0 =0,2 0,6 Il 0,4 
La vraisemblance de l’échantillon (X1,...,X,) de cette loi de Bernoulli s’écrit : 


LG... x 0) = 021% (1 — 09 Dan 


avec x; € {0,1} ,1 <i <n. On note Lo la vraisemblance pour 0 = 0,1 et Li pour 
0 = 0,2. Les espérances a posteriori des coûts sont : 


EI[C (Do)] = 0,670 + 1,27: et E[C (D:)] = %o + 7m = ] 
La règle de Bayes conduit à souscrire le contrat si £ [C (Do)] > E [C (D:)] soit: 


0,6%0 + 1,271 > 1 => 0,36L0 + 0,48L; > 0,6Lo + 0,4L; 
— 8L; > 2415 


de 8 
= (n2 = ins) DE > In3 — nins 


n In3 — nin- 
> Xi > 9 
i=1l In— 
4 
Pour un échantillon de taille ñ = 100, on décide de souscrire le contrat d’entretien si 
100 100 


dx > 15,9 soit, puisque les x; ne prennent que des valeurs entières, ss x; > 16. 
i=1 il 
100 


Ayant observé >. Xi = 13, la règle de Bayes conduit à ne pas souscrire le contrat 
i=1 


d’entretien. 


Exercice n°2 


La vraisemblance s’écrit : 


L'(x1,...,Xn; M) = (=) Er >] 


La forme de la région critique, donnée par le théorème de Neyman et Pearson, est 
Lo/L; < k, ce qui en passant aux logarithmes conduit à l’inégalité : 
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n 


1 
5 2 LG D? Gi —15)] < Ink 
i=l 
Elle est équivalente, après développement du crochet, à : 
= Sn 
—V x; + <2Ink 
i=l 4 


Pour l'instant, on cherche seulement à déterminer la forme de la région critique et l’ex- 
pression des constantes qui apparaissent dans cette inégalité est sans intérêt. On remplace 


n 
donc cette inégalité par >. x; > ki, qui lui est équivalente. La région critique est donc 
i=l 
définie à partir de la valeur de la somme des observations. Cependant, comme c’est la loi 


de la moyenne empirique X, qui est connue, il est préférable de faire intervenir cette 
moyenne dans la définition de la région critique W, qui sera donc l’ensemble des points 
(X1,...,Xn) tels que : 
x: 'C 
Il reste à préciser la valeur de cette constante C, qui sera le seuil de cette région, à par- 
tir du risque de première espèce « qui est fixé. Il représente la probabilité de cette région, 
lorsque l’hypothèse nulle est réalisée, et par conséquent, la condition qui définit C 
s'écrit : 

a = P(Wim=1)= P(X, >CIm=1) 


Sous Ho, la moyenne empirique X, suit la loi N ( 1/ Vn) , donc en centrant et rédui- 


sant on obtient la condition : 


= P pet 
s-n(0265) 


où U est une v.a. de loi N (0,1). Ainsi la constante C est définie par : 


u 
C=1+— 
Tom 


où u est le fractile d’ordre 1 — æ de la loi N (0,1). Pour un risque & = 0,05 on lit dans 
la table 2 le fractile u — 1,6449 d’où une région critique définie pour ñn = 25 par : 


W = {(x1,...,225) /X%25 > 1,33} 


Dans ce cas, la puissance du test est la probabilité de cette région dans l’hypothèse alter- 

native, soit : 

1,33 — 1,5 
1/V25 


Pour un risque & = 0,05 la condition n > 0,90 conduit à choisir une taille d’échan- 
tillon n telle que : 


n=P (Rs>133m= 1.5) = P(U> }-rw> 0,85) =0,8023 


n=P(R>i+ Emeis)=P(u>u- %) 2090 
n 
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ce qui est équivalent 1,6449—,/n/2 < —1,2816 soit /n > 5,853 donc une taille 
d’échantillon supérieure à no = 35. 
Exercice n°3 


Pour effectuer ce test, nous disposons d’un échantillon d’une loi normale centrée, d’écart 
type o = 1 sous Ho et o = 2 sous H;. Le rapport des vraisemblances a donc pour 
expression : 


La région critique est donc définie par le théorème de Neyman et Pearson comme l’en- 
semble des points (x1,...,x,) tels que : 


n 
Dx>c 
i=1l 


La valeur de la constante C est déterminée par la condition : 
n 
a = BD > CiH) 
i=l 


n 
Sous l’hypothèse nulle Ho.) x suit la loi Fée donc C est le fractile d’ordre 1 — æ de 
i=l 
cette loi. Pour & = 0,05 on lit dans la table 5 la valeur C = 25. La puissance du test 
est : 


n=r(Sx>cim) 
i=1 


n x? 
Sous l’hypothèse H:3 Fa suit la loi X2: donc : 


i=1 

1 C 
= P D X2> — | = 0,97 
d (5 ; +) PTS 


par lecture de la table 5. Notons qu’ici le risque de seconde espèce B = 0,025 est infé- 
rieur au risque de première espèce & — 0,05. Pour respecter la logique de Neyman et 
Pearson, il faudrait donc choisir un risque de première espèce plus faible. 


Exercice n°4 


L'expression de la vraisemblance est : 


n n —0—1 
best lo te (TI) 
i=1 


pour x; >1,1<i<n. 


Le rapport des vraisemblances, Lo sous Ho, et L\ sous H;, s’écrit donc : 
1-6 
Lo % n n 1—00 
== (à) (Ts 
Li ê i=1 
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Le théorème de Neyman et Pearson, qui permet d’obtenir le test de puissance maximum, 


, ; ”_ … Lo ; use 
définit la région critique par la condition Z. < k, qui est donc ici équivalente, en pre- 
1 
nant les logarithmes, à : 


(81 — 60) Le Inx; < ki 
i=1 


Puisque 4 > 6, cette région critique W est définie par la condition : 
n 
Ÿ_ mx, <C 
i=1 


La valeur du seuil C est déterminée par : 


P (W|\Ho) = P Ji X; < CIO : 

(0 Æ— = NA; & = = 
i=1 | 3 

La taille d’échantillon permet ici d’utiliser le théorème central limite que nous allons 


= 12 
appliquer à Ÿ, = — ) Yi, ayant posé Y; = InX;,1 <i < n. Il nous faut pour cela 
n { 
i=1 


déterminer la loi de la v.a. Y = InX. Sa fonction de répartition est définie par : 
G(y)=P(T <y)=P(InX <y)=P(X <e') = F(e?) 
pour y > 0. On obtient la densité par dérivation : 
gG)=e f (@°)= 0e" 
On reconnaît la loi exponentielle de paramètre 0, donc E (Y) = ; et V (Y) = Ph 
D’après le théorème central limite : 


Y, — 1/0 
= —> | 
ce 1/0 loi MD 


La constante C est alors déterminée approximativement par : 
_ C Er … C 
a = P(r, < ) = P [Vi (ar, - 1) < Vn (ae - 1) 
n n 


Le fractile d’ordre 0,05 de la loi N (0,1) a pour valeur —1,645 donc la valeur approchée 
du seuil C est définie par la condition : 


4 
(5 = 1) = —1,645 
3n 


Soit, pour n = 400,C = 275. La puissance est déterminée par : 


_ 8 = C 
= P(W|H,)=P nX;, <CO—=-]=PIY,< — 
n (WIH) (Dr | :) ( 2) 


= P vi (ur, - 1) < (as _ 1) 
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Sa valeur approchée est définie par 7 = ® (2,02) = 0,98, où ® est la fr. de la loi 
N (0,1). Notons que le risque de seconde espèce B = 0,02 est inférieur au risque de 
première espèce & = 0,05. 


Exercice n°5 


1) La vraisemblance est : 


1 1 
L MS ds n3 0,À = — EX AE i nÀ/0 
er x ) 2 P( À > x) 


à condition que tous les x; soient supérieurs à À, ce qui est équivalent à la condition 
Mn = Min{x,,...,Xn} > À. La vraisemblance est une fonction croissante de À avant 
m, et nulle au-delà, donc atteint son maximum pour À = m,. L'estimateur du maximum 
de vraisemblance est donc : 


À = m, = min{X,,...,Xh} 


Sa loi de probabilité est définie dans l'exercice 15 du chapitre 3. On voit que la va. 
Mn — 


À 
Z=n suit une loi exponentielle, avec E(Z) = V(Z) = 1. On en déduit : 


0 0? 
Efmi)=À+- et V(m,) = > 
n n 
C'est donc un estimateur asymptotiquement sans biais et convergent. 


2) La log-vraisemblance a pour expression : 


1 n 
In LG. 2n5 0,1) = —n M0 — = 2G 1 
Cette fonction est dérivable pour tout 0 > 0 avec : 


ôln L n 1 
= x 
50 — 6 6 2 


n 
La dérivée s'annule pour 0 — SG — À)/n ; la dérivée seconde est négative pour cette 
i=1 
valeur : 


ML n 2% 
907 67 6 2 d 


L'estimateur du maximum de vraisemblance est donc : 


Cet estimateur est asymptotiquement sans biais : 


E(,) = E(X) — E(m,) = 0 


résultat déduit de l'exercice 15 du chapitre 3. 
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D'après la loi des grands nombres, X, converge vers E(X). Nous avons établi que m, 
convergeait vers À, donc ô, converge vers 0 + À — À = 0. 
D'après ce qui précède : 
0 9? 
E[VnGm, -D]= —= et V[V/n(m, - D] = — 
Vn n 
Ces deux moments tendent vers 0 avec 1/n donc : 


(my — À) — 0 
P 
Nous pouvons écrire : 
Vn@, — 0) = Vn(X, — 0 — 2) — Vnm, — à) 
Le théorème central-limite et le résultat précédent nous permettent de conclure : 


Vas — 0) — N(0,0) 


3) La région critique de ce test est construite à partir de l'estimateur du maximum de vrai- 
semblance de À. Comme À1 > Ào, elle est définie comme l'ensemble des points 


(x1,...,X%n) tels que m, > C. La constante C étant définie par : 
C—Xx 
a = P(m, > C|Ho) = exp —n 2 2 
soit C = À — (0 Inœ)/n. Le risque de seconde espèce est : 
C—A Ào — À: 
B = P(m, <C|H)=1—-exp-n F =1l—-œexp—-n 


La puissance s'en déduit par n = 1 — B. 


4) On utilise le théorème de Neyman et Pearson et on forme le rapport des vraisem- 


blances : 
Lo Ge) 1 À € 
= |} ex (x; — À) (x; — À) 
Li Ko r| a 2 mA >; 


En prenant le logarithme, on définit la région critique par l'inégalité : 


Comme 0, > 60, ceci est équivalent à : 


Ÿ& = À) > k! 
is 


La valeur de À étant inconnue, on doit utiliser une approximation en remplaçant ce para- 
mètre par son estimateur : 


A 


On = Xn — Mn > C 


La constante C étant définie approximativement par : 


: ô, — 8 C—0 
a = PÉ, > Ci) = P(VR = lon . +) 
0 0 
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On retient donc comme valeur approchée du seuil : 
CT 

= = 

0 . 


où u est le fractile d'ordre 1 — æ de la loi N(0,1). 


La puissance se calcule alors par : 


: _6,—0 C0 
n= PÈ > CH) = P(V à Len à ) 
1 1 


en utilisant à nouveau la loi asymptotique N (0,1). 


5) La région critique précédente dépendait des valeurs respectives de © dans les deux 
hypothèses. Le test de région d'acceptation définie par : 


Ci < CA < C 
n'est donc pas UPP. Les valeurs approchées des seuils critiques sont : 


Ci=0 CR 

=—-u —— = u —— 

1 0 a 2 0 Un 

où u est le fractile d'ordre 1 — æ/2 de la loi N(0,1). On ne peut pas calculer la puis- 
sance de ce test, l'hypothèse alternative étant multiple. 


6) Pour 0’ > 6 le rapport des vraisemblances Ly/L, est une fonction croissante de ô,. 
D'après le théorème de Lehmann, la région critique du test de la question 4 est celle d'un 
test UPP pour les hypothèses confrontées ici. Son risque de première espèce est défini 
par : 


a(8) = P(ê, > C|Ho) = P(Vi 2 > V/n +) 


Cette fonction atteint son maximum, d'après le théorème de Lehmann, pour 8 = 6. Si 


on utilise la loi asymptotique, le seuil /7(C/0 — 1) est une fonction décroissante de 6, 


donc & est bien une fonction croissante de 6. 


Exercice n°6 


L'hypothèse alternative étant une hypothèse multiple, on détermine d’abord la région cri- 
tique du test entre les deux hypothèses simples : 


H :0=1 
H; :0—06, 


avec 0, quelconque, mais vérifiant 0, > 1. L'expression de la vraisemblance est : 


L( = ff)? ( 9 à (£ Ve ( RS , 
X1,44., Xp; = Exp Xi ] = exp| — — x; 
y Ÿ 27 2 27 2 


i=1 


Le rapport des vraisemblances, Lo sous Ho, et L\ sous H;, s’écrit donc : 


ge 1\"2 1 n ; 
— = | — — (1-08 : 
D =(x) eP-50-p x 
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Le théorème de Neyman et Pearson, qui permet d’obtenir le test de puissance maximum, 
, ; 5e … Lo | A ge 
définit la région critique par la condition A < k, qui est donc ici équivalente, en pre- 


1 
nant les logarithmes, à : 


1 n 
5-60) x? < ki 
i=1 


Puisque 4, > 1, cette région critique W est définie par la condition : 


n 
De<c 
i=1 


La valeur du seuil C est déterminée par : 


a = P(W|Ho) = r(>x < C|0 = 1) 
i=]l 


n 
Sous Ho, les v.a. X; sont normales, centrées, réduites et indépendantes, donc > X . suit 
i=l 
une loi du khi-deux à n degrés de liberté. La valeur du seuil C est donc celle du fractile 
d’ordre æ de la loi x2. La région critique est indépendante de la valeur choisie pour 61, 
donc elle est aussi celle du test UPP pour l’alternative H; : 0 > 1. La fonction puissance 
est définie pour 0 > 1 par: 


n (8) = P (WI) = (XX < C8 > 1) 
i=1 


Elle se calcule à partir de la fonction de répartition F, de la loi x2 par : 


n (0) = F; (0C) 


Pour n = 15 eta = 0,05 on lit dans la table 5 la valeur C = 7,26. Pour 0 = 3 la puis- 
sance vaut alors 7 (3) = F15 (21,78) © 0,9. 


Exercice n°7 
L'hypothèse alternative étant une hypothèse multiple, on détermine d’abord la région cri- 
tique du test entre les deux hypothèses simples : 
H : 6 =5 
H 1:00 — 0] 
avec o\ quelconque, mais vérifiant o, > 5. L'expression de la vraisemblance est : 


n 


L( o) El L ex L ( 
Xl Xn 0) = Xi 
| 7 oV27 P 17 207 


: 1 n 1 n _ . 
(=) so D | 


1007 | 
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Le rapport des vraisemblances, Lo sous Ho, et L, sous H;, s’écrit donc : 


Lo fav”? RAR IS 3 
UE A peer ; — 100 
Fa É) ow | Ce =) | 


Le théorème de Neyman et Pearson, qui permet d’obtenir le test de puissance maximum, 
: : e …. Lo ; A ns 
définit la région critique par la condition A < k, qui est donc ici équivalente, en pre- 


nant les logarithmes, à : 


Puisque o? > 25, cette région critique W est définie par la condition : 
n 
D Gi — 100) > C 
i=l 


La valeur du seuil C est déterminée par : 


a = P(W|Ho) = P(D x — 100)? > Clo = s) 


i=1 
Sous Ho, les va. X; — 100 sont normales, centrées, d’écart type o = 5 et indépen- 
n 
dantes, donc >. (X; — 100) /25 suit une loi du khi-deux à n degrés de liberté. La 
i=1 
valeur de C/25 est donc celle du fractile d’ordre 1 — & de la loi x2. La région critique 


est indépendante de la valeur choisie pour 01, donc elle est aussi celle du test UPP pour 
l'alternative H : & > 5. La fonction puissance est définie pour o& > 5 par: 


n(o) = P (WIHi) = P(5 x — 100) > Clo > s) 


i=1 


Elle se calcule à partir de la fonction de répartition F, de la loi x2 par : 


1O=1-R (5) 


Pour n = 10 et & = 0,05 on lit dans la table 5 la valeur C = 25 x 18,3 — 457,5. 


Exercice n°8 


Il s’agit de tester l’hypothèse H9 : À = 2 contre l’hypothèse H; : À < 2 à partir d’un 
échantillon de taille n — 6. On effectue d’abord le test d’hypothèses simples H6 : À = 2 
contre H; : À = Àj avec À; quelconque, mais vérifiant À, < 2. Le rapport des vraisem- 
blances, Lo sous AH, et L; sous H;, s’écrit : 


n 


Lo = ge *@—Àn) er 


L; À: 
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Le théorème de Neyman et Pearson, qui permet d’obtenir le test de puissance maximum, 
, ; _ … Lo ; use 
définit la région critique par la condition Z. < k, qui est donc ici équivalente, en pre- 


1 
nant les logarithmes, à : 


(n2— Ina) dx < ki 
i=1 


Puisque À, < 2, la région critique W est définie par la condition : 
n 
Dx<c 
i=1 


La valeur du seuil C est déterminée par : 
a = P(W|Ho) = r(ÿx < CA = 2) 
i=1 


C’est donc le fractile d’ordre & de la loi de Poisson de paramètre 2n. Pour ñn = 6 et 
a@ = 0,05 on lit C = 6. La région critique est indépendante de la valeur choisie pour 
À1, donc elle est aussi celle du test UPP pour l’alternative H : À < 2. Au bout de six 
mois, on considère que le contrat a été efficace si on observe un nombre de pannes infé- 
rieur ou égal à 6. 


Exercice n°9 


Les deux hypothèses sont multiples. On détermine d’abord la région critique du test entre 
les deux hypothèses simples : 


H:m—=mo 
H :m=m; 


avec Mo et M1 quelconques, mais vérifiant Mo < 3 et mi > 3. La vraisemblance 
s’écrit : 


Lens = es | DC n| 


La forme de la région critique, donnée par le théorème de Neyman et Pearson, est 
Lo/Li < k, ce qui en passant aux logarithmes conduit à l’inégalité : 


-; de [Gi — mo)? — (xi — m1) ] < Ink 
i= 


Elle est équivalente, après développement du crochet, à : 


ni — mo)Xn > ki 


1 n 
ayant POSÉ Xy = — > x;. Cette région critique est indépendante des valeurs de m9 et 
i=l 
m qui vérifient toujours m1 — mo > 0. C’est donc celle du test UPP pour H, : m < 3 
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contre H, : m > 3 et se définit par : 
Xn 2 C 


On peut aussi appliquer le théorème de Lehmann. Le rapport des vraisemblances s’écrit : 


= exp] ; (8° —-07)+n(0 —0") | 


C’est une fonction croissante de X, pour 0 > 0’ donc x, > C définit la région critique 
d’un test UPP. La valeur de la constante C est déterminée par : 


u=P(Wim=3)= P(X,>Clm=3) 


Pour m = 3, la moyenne empirique X, suit la loi N 25 1// n) , donc en centrant et 
réduisant on obtient la condition : 


= P Fe 
se) 


où U est une v.a. de loi N (0,1). Aïnsi la constante C est définie par : 


U 
C=3+-— 
+7 


où u est le fractile d’ordre 1 — æ de la loi N (0,1). Pour un risque & = 0,05 on lit dans 


la table 2 le fractile u — 1,6449 d’où une région critique définie pour ñn = 100 par : 


W = {(x1,...,3100) /X100 > 3,16} 


La fonction puissance du test est : 


nm = PR, >3+ im > 3) = P{U > HG 1m) + 1645] 


= 1— [1,645 — /n(m—3)] 
où ® est la f.r.de la loi N (0,1). 


Exercice n°10 


Les hypothèses en présence sont de la même forme que dans l’exercice précédent. Mais 


ici, pour m = 6, la loi de la moyenne empirique X, est inconnue et nous ne pouvons pas 
déterminer le seuil. Nous allons utiliser une autre statistique, de loi connue pour m = 6, 


qui sera 71 (X; — 6) /Sn, de loi de Student à ñn — 1 degrés de liberté. La région cri- 
tique est définie par la condition : 
Xn — 6 


Sn 


Vn > C 


On détermine la valeur de C par : 
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Pour n = 12 et æ = 0,025 on lit dans la table 6 la valeur € = 2,201. On ne peut pas 
calculer la fonction puissance qui est définie par : 


X, — _X, - = 
nm) = P(V s * > cm >6) = P(Va —>C Vn— <) 


n 


est une v.a. 


m— 
puisque C — /n 


n 


Exercice n°11 


Nous allons appliquer le théorème de Lehmann. L'expression de la vraisemblance est : 


FO Us x D) (ee -5 25) 


i=1 


pour x; >0,1<i<n. 
Le rapport des vraisemblances s’écrit : 


EG 0) g'\" 0-0 À 
Den (9) ex 1 00! » | 


C’est une fonction croissante de S, = DRE Va; pour 0 > 8" donc S, > C définit la 


région critique d’un test UPP. La valeur de la constante C est déterminée par : 
n 
a = P(W|6 = 1) = P(D VX > C6 = 1) 
i=l 


Nous allons d’abord déterminer la loi de la v.a. Y — 4 X à partir de sa fonction de répar- 
tition définie par : 


GO=PH<YN=P(VX<5)=P(X<y)=F(5) 
pour y > 0,F étant la f.r. de X. On obtient la densité par dérivation, soit pour y > 0 : 
80) =2yf (>?) = : Cu 
On reconnaît la loi exponentielle de paramètre 1/0, ou loi y (1,1/8). La va. 
Sn = 5 Fée est la somme de n v.a. indépendantes et de même loi y (1,1/0), donc 
i=1 


suit une loi y (n,1/0). On utilise le résultat du chapitre 3 $ ILE où on avait établi que 
25,/0 = Xe On a donc ici : 


D (VX > Clé = 1) POS SIC) 
i=] 


Ainsi, 2C est le fractile d’ordre 1 — & de la loi ER Pour æ = 0,01 et n = 15, on lit 
dans la table 5 la valeur 2C = 50,892 soit un seuil € = 25,45. La fonction puissance 
du test est définie pour 0 > 1 par: 


n (0) = (D VX > C6 > 1) = P(25,/0 > 2C/0) = 1 — K (2C/6) 
i=1 


avec K qui est la fr. de la loi Hs 


282 e STATISTIQUE ET PROBABILITÉS 


© Dunod. Toute reproduction non autorisée est un délit. 


Exercice n°12 


Nous allons associer à une machine de type A (resp. B) une variable indicatrice de 
Bernoulli X (resp. YŸ) de paramètre p (resp. p2). On dispose d’échantillons de ces deux 
lois, d’effectifs respectifs n1 — 80 et n2 — 60, pour effectuer le test : 


per Pi = P2 ee 
Hi: pif p2 Hi:pi-p#0 
Les moyennes empiriques X et Y de ces deux échantillons permettent de définir l’esti- 


mateur sans biais X — Ÿ du paramètre à tester 9 = p1 — p2. Sa loi approchée est une 


loi normale d’espérance @ et d’écart type inconnu © = /p1q1/n1 + P2q2/n2 où 


qi = 1— p; et g2 = 1 — p2. Sous l’hypothèse nulle, on estime la valeur commune 
P = Pi = P2 par la réunion des deux échantillons : 


PR un (x+Er ) 


ni +n2 ni +n2 


Cet estimateur permet aussi d’estimer dans ce cas l’écart type 


o = Yp(l— p)(1/n;1 + 1/n2).On effectue alors le test à l’aide de la v.a. normalisée : 
2 X-7 
VBA — D) A/m +1/n) 


dont on peut admettre, compte tenu des tailles d’échantillon, qu’elle suit approximative- 
ment une loi normale standard dans l’hypothèse nulle. La région critique est définie par 


| > C, où on retient comme valeur approchée du seuil C celle qui vérifie 
a = P(IU| > C), avec U de loi N (0,1). Pour la valeur standard & = 0,05 la région 
critique est définie par | > 1,96. On obtient pour ces échantillons 

x = 0,625,y = 0,667,p = 0,643, /p (1 — p) (1/n1 + 1/n2) = 0,08 


et (6 = 0,51 donc on accepte l’hypothèse nulle d’équivalence des deux types de machines. 


Exercice n°13 


Chaque série d’observations est un échantillon des v.a. X et Y, de lois respectives 
N (m:,01) et N (m3,02), ces quatre paramètres étant inconnus. Les deux échantillons 
proviennent de la même loi si les paramètres sont égaux deux à deux. Le premier test à 
effectuer sur les espérances est : 


Eee mi = M) re 
Him £ m Him —-m ZÆ0 


et utilise pour cela l’estimateur sans biais X — Y dem; — m2. Cet estimateur suit une 
loi normale centrée sous H5, mais de variance inconnue 6, {ni + 0? /n, où n1 et n2 
sont les effectifs des échantillons respectifs des lois de X et Y. On utilise donc les esti- 
mateurs sans biais de 6 et a qui sont respectivement : 


fs EE _ ds, 2 


5 (x -Xx) et $=—— > (@%-7) 


11 i=1 


= 


X 


n; — 1 
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Si on remplace l’écart type inconnu par son estimateur “ S?/n1 + S?/n2 pour réduire 


X — Y, on n’obtiendra pas une loi de Student. Il faut pour cela que l’écart type des deux 
échantillons soit le même. On doit donc faire le test préalable d’égalité des variances : 


H : Elo = 1] 


Ho : 0? = 0}? 
Hs ol 


Hyso rene) 
On accepte l’hypothèse nulle si le rapport S? / S est voisin de 1, soit une région d’ac- 


ceptation de la forme : 


Si on répartit le risque «& de façon symétrique, les valeurs des constantes a et b sont défi- 


nies par : 
œ S? Le 
—=P|—= <alH]=P|—= >b|H 
2 S° s’ 


avec $2/S2 qui suit une loi de Fisher-Snedecor F (n1 — 1,n2 — 1) sous Ho. Pour la 
x y q 


1 
valeur standard œ = 0,05 on lit dans la table 7 le fractile a = 1.80 = 0,56 et 
b = 1,74. La valeur calculée de S2/ s’ pour cet échantillon est 1,44 donc on accepte 
l’égalité des variances. On retient alors comme estimateur sans biais de la variance com- 


mune 0? = 0? = 0% : 


(ni — 1) S$ + (n2 — DS 
_ nn +n) —2 


$s2 


La région critique du test initial est alors définie par : 
X=7 
EN 
Sy l/ni + 1/rm 


Le seuil f est déterminé par : 


Cher : 
a Crea di ) 


C’est donc le fractile d’ordre 1 — &/2 de la loi de Student à ñn1 + n2 — 2 degrés de 
liberté. Pour & = 0,05 on lit dans la table 6 le fractile { — 1,984. Pour cet échantillon, 
on observe s = 1,52 et : 


T5 
sYT/n;1 + l/n _ 


On refuse donc l’égalité des moyennes de ces deux lois. 


9,77 
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Exercice n°14 


Dans l’hypothèse nulle d’indépendance des caractéristiques de taille et de CSP, la répar- 
tition de la population est obtenue à partir du produit des effectifs marginaux. Par 
exemple, le nombre d’ouvriers de moins de 165cm serait dans ce cas 


1900 x 413 
2700 


au tableau suivant : 


= 290,6, arrondi à 291 puisqu’il s’agit d’effectifs entiers. On aboutit ainsi 


Ouvriers Employés Cadres Total 

Moins de 165 cm 291 73 49 413 

De 165 à moins de 170 cm 457 115 77 649 
De 170 à moins de 175 cm 645 163 109 917 
175 cm et plus 507 128 86 721 

Total 1900 479 321 2700 


La région critique est de la forme D, > C où C a comme valeur approchée le fractile 
d’ordre 1 —@ de la loi du khi-deux à six degrés de liberté, pour un test de risque de 
première espèce &. Pour &« = 0,05 on lit dans la table 5 la valeur € = 12,6. La valeur 
de la statistique utilisée pour ce test est ici D, = 58,2 donc on rejette l'hypothèse d’in- 
dépendance. La conclusion serait la même pour un risque œ = 0,01, le seuil étant 


C = 16,8. 
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ables statistiques 


Table 1 : Fonction de répartition de la loi normale centrée réduite 

Table 2 : Fractiles de la loi normale centrée réduite 

Table 3 : Loi binômiale 

Table 4 : Loi de Poisson 

Table 5 : Fractiles de la loi x? 

Table 6 : Fractiles de la loi de Student T, 

Table 7 : Fractiles d’ordre 0,95 de la loi de Fisher-Snedecor 

Table 7 (suite) : Fractiles d’ordre 0,975 de la loi de Fisher-Snedecor 

Abaque 1 : Intervalles de confiance pour une proportion (bilatéral de niveau 
0,90 ou unilatéral de niveau 0,95) 

Abaque 2 : Intervalles de confiance pour une proportion (bilatéral de niveau 
0,95 ou unilatéral de niveau 0,975) 


Ces tables sont publiées avec l’aimable autorisation de la Revue de statistique 
appliquée, numéro spécial Aide-mémoire pratique des techniques statistiques, 
éditions du CERESTA, 1986. 
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Table 1 
Fonction de répartition de la loi normale centrée réduite 


Probabilité F(u) d’une valeur inférieure à u 


Un [oo Too [02 [ oo [ ous [ ons [| oo [ oo [ am | où 


gg | 05040 | dsl |ostés | 06199 | ws230 | 0,5279 | 05319 À 05350 
05438 | 05478 | o,5517 | 05557 | a,5694 | 0566 | 0,56175 | os7ia | 05753 
eses2 | assez À osogu !osgas |'osust | woué | 06064 | oéloa À oéiat 
06217 | 06255 | 06293 | 633) À és | Géans | 06443 À otre | 06917 
oésgt | aco2s | océés | 06700 | serie | terra | oeu0s À 06x42 E D6s70 


Déni | 06985 | 07019 | U7US4 | D.TU8# 0,7123 | ©7157 | O,7iX À O,Ttid 
07281 E 7124 | 0,757 L'OTASS | QT DT | ETAdé | OYSIT | GT 
D7611 | 07642 | 0,673 | G,7704 | 0,774 Gé À 7704 | (7824 | 0,742 
Q7910 | 47939 | 0,396 | 07995 | UAUT D4USE DAUTS | QElD | 0,8133 
OA4186 | O,4212 | 06238 | OK264 | O,R24O GLASS | NAdd0 | ARMES | QAMES 


Ü4438 DÉ4Gl | nas OHSU8 | U,6531 0.454 Ds | CS | D,ARGTTE 
Û.6663 06686 | GLS D#328 | 0,8/4à OT ŒAvot | GSñID À O,ARAA 
0,546 QusES | OSGUT | 06925 |'UKg4A O,4062 | (4980 | CES8T À (901$ 
0,904 | 09066 | GO0K2 | 09098 | OISE NStsE QO147 | OSlét | 04177 
UT |'endagi | OU | (21 À 0,926 (.92479 49292 | 09306 | 0.494319 


agus |'osaisr |'oosvo | ouses |'ugiga | agam | agars À nuas | do4al 
00463 | oga7s | cos | ouus | oesos | agsis | 0062 | oasas | 09645 
0964 | ousra | ogsar |'ussu | uso | aan | aoéts | qoc2s | 46433 
00649 À 09656 | God Face | agrx | docs | ogcus | Ogéog | orge 
og719 | oz À og7a2 | ocre | 00744 | og | ogise | Qomt | 49747 


0.9779 | 09783 | COTES | UB703 | G970S 0,901 QSCS | OAI | OST 
COR | QUAMT | ARS | AGE | 0342 | 09846 | 09850 | 09654 | 0887 
U9é£ | CUBE | ASETI | 00875 À (LDATE RCE QUREd [RAT | 06800 
O9ENS À OONUS À OAI | GG | DO | 69000 | Oil | OS | Hole 
0.9920 | 09922 | 09925 | 04917 | Qo6av | 69931 GOT [EL OGUIE 


09940 À 09941 | 09943 | uug4s | coodé | 09048 | o.s040 | 00951 À noos2 
00958 | 06066 |'augst |'ogusg | ouoen | nouer | o.c062 | 09663 | ago 
o.9966 À 09967 | oguee |'ocogo Enoom | coo71 | a,9072 | ooo7a | noota 
0.997$ À 0% | ogg? |'ouorz Ecosse | 00070 | a,o070 | ogosn | aso1 
0,9982 | o,9942 | oggsx | ouusa Eosssa | 09985 | ooous | ooosé | oooss 


Tables pour les grandes valeurs de u 


Fu HE ggg0d L 0,99431 | 099962 | 99966 | 099016 | O990641| 0,690628! D OSOÛ6E | 0,999%07 
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Table 2 
Fractiles d’ordre P de la loi normale centrée réduite 
Lecture de la table 2 des fractiles. 
Si P < 0,50 : le fractile est négatif, donc on ajoute le signe — à la valeur lue dans la table. 


0,004 troisième décimale de P 


(en haut) 


2 premières décimales de P (à gauche de la table) 
Le fractile d’ordre 0,244 vaut : — 0,6935. 


Si P > 0,50 : on lit normalement. 
2 premières décimales de P (à droite) 


1,7060 [0,95 
À 
0,006 troisième décimale de P (en bas) 


Le fractile d’ordre 0,956 vaut : 1,7060. 


Fr oo | 0001 à 000 | 0002 | aoû | ao0s À ooc6 | 0007 | ou | ao ['acio 


000 | æ |3oo02iaraz far |2asar fo,s7sa las | 24573 [234000 929 
got |2,4263 | 22904 {22571 | 2,2262 | 2,107 | 21701 | 2, 1444 | 2,1201 | 2,0969 | 2, 08 
GC? 120837 [240738 1,20141 | 1,9954 | 1,9774 L 1,600 | 1,9431 | 1,9268 | LS | 1, 9,97 
O0 EILBSOR F1 866 | 16522 | 1,6364 | LK250 EL,8110 | 1,7997 | 1,866 | 1,774 0.36 
oo iso fi,rio | Lrzre lines | 17060 ) 1,6064 | 1,6649 | 1.6747 | 1.666 | 1,65 995 
ous |réto | 1ese | 26258 | 16164 | 16072 [1.582 |1.5802 | 15805 | e.571x | 1,562 5,94 
OCR À SAS À ISA | I,5387 | LSSON L'S220 | 15141 À 15063 | 1.485 | EAKF) LA 0.93 
DO | RATS | AREA TAG | LASSE | 14466 | 1,4395 V7,4325 | 14155 | 4187 nu 
dos 40e | 13084 |1.3017 | 13882 [1,787 | 13720 l'iaces l13508 | r.3532 À UE 
009 [13408 [13246 11,286 1,225 |1.3165 À 14106 | 1.047 À 12688 | 1,2930 | 1,2873 DuD 
IG LLASES 114759 | 12904 lnd646 12591 | 12526 | 12481 | 12426 [ 1,2372 | 1,2419 G,85 
out rés ai | 12460 [12109 | 12085 [12008 |nvgs2 | ragon Pre | 11800 O8 
DZ À 9760 LITE) LG [71607 | 11552 | 11503 | 1.1455 | 11407 É1,1359 | 1,131 G.87 
CEA 1,264 À LAIT | ENITO TT | LL D 'OLÔGE | TUOES | 109239 À DONS | LOS GG 
04 | 1803110758 | Lo7i4 | 1,066 | 10625 | 1,584 | 1.0537 | 10404 | 10450 | 10407 ESS 
ous | 63641 10922 | 10270 | 10257 | 1.4 | 10152 | 14atie | 10060 À 1,6027 | 00586 0,84 
6 |09945 {00904 |o.08s3 | ogg | 09782 | c.9744 | 9701 | o6er |o,9621 | 09581 D,83 
017 [09542 | 09502 | 09463 | 09424 | Gars | 9346 | 0.9307 | 09269 | 09230 | 6,5102 9.82 
ae Jos fogtie |ouors [uso |osonc | oR0es | 0.8927 | 6800 | 0,6853 | 0,816 O8 
ie |08778 [08742 | 08705 | s6és | 08633 | 0.506 | anses | tk&524 Losass | 08452 0,80 
oo (ossié ose |0834s | ossi | 08274 | 08239 | 0.8204 | 0.&169 |0,8154 | 08000 9,19 
0,21 |o8064 [oso0 | o7uvs [o,raét | 07026 | 0,7892 | 07858 | 0,7824 | 0,330 | o,7156 UE 
022 [07722 ocss | o6ss o,en |o7ss | 07554 | 047821 | o7488 | 0,7454 | oral 077 
O2 | 07368 | 0,7356 | 07323 | 0,7290 | 0,7257 | 07225 | 782 | 67160 [07128 | 0,7095 O,76 
DM [07063 | 0,701 | 06008 |0,6967 | 0,6935 | .6903 |'O,6471 | Gégac | 0,6808 | 06776 GS 
025 |os7as [06713 |os6e2 [ocest | cec20 | eésax |oess7 | n,6526 À 0,6405 | c6464 0.14 
026 [06434 |O6G4T | 06372 [06341 | Gest | 06280 | Gû250 | 06219 4 06189 | 0,6158 0,73 
027 [06128 [ososs | oanés [oeoss | 0008 | a,5908 | 0,5948 | 0,591 À 0.saes | 0,susa | 0, 0,72 
028 [05828 [0,57 | 0,579 [0,5740 | 0,5710 | o.5681 | 0.s651 | 05622 | 0,sso | 05563 O7 


025 |0,55%4 [05505 | 05476 | 0,5446 | 05417 | 0,5388 | 0,5359 | 0,5330 | 0,5307 | 0,5273 


cos [oc | oacs | ao | 0006 | ous | 0.004 | 0.005 | oco2 |ooar | oo | P 
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Table 2 (suite) 


Fractiles d’ordre P de la loi normale centrée réduite 


oO | 0601 | 4002 

0,5244 [04215 | 0,5187 

0,4960 E04930 | 0,490 

04677 | 04648 04621 

0,4309 104572 | 04344 04289 
QA125 l04097 | 647 04016 
0,3853 [03820 | 037% 0.3745 
03585 103558 [03534 0,3478 
3319 F 0,720 | 0.5266 QAZ1a 
0,055 | 6,3029 | 0,002 [2050 
ü,2793 | 42767 | 0.7741 02689 
02533 | 02508 | 0.242 02410 
0,2275 | (2250 À 0,22%4 02173 
02049 | 6,199 À 0,198 W,1917 
Q,1764 | U173E | 01713 O, 166 
GLS | 01484 À 6,14<9 DIAE 
0.1257 |0,1231 | 0.206 01156 
Lien | 96079 | 0.094 DDUD4 
au753 | 0728 | 0.0702 00652 
00562 | 40476 | (MSI 00401 
0001 | 40226 | 0,020 o,51$0 
do OQUS 0,006 


ü,1030 
GOTTS 
00527 | 00502 
1,0276 | 00251 
0,00? | c0000 


5,2974 


Tables statistiques @ 291 


Probabilités cumulées 


Table 3 
Loi binômiale 


ke 
Probabilités cutnulées Pr €X £ ec) = De pr 
mic pat = pie paie paf 
Û 0,6648 0.5987 | O,S1é 0.3594 
1 0,9418 | 09139 | 08824 Q174û 
“ 0.0938 | G984S | (9812 ü5atitk 
3 09996 | 0.9990 | (99ët 09912 
IQ| 4 il Q.9999 | (4908 6,999 
5 I 1 09999 
6 I 
Ets 
Û 04420 | 04585 E 02901 | 2442 | O,CH47 | OI516 
Ê 08103 | 07454 | 06608 | 05869 | Sté | 0416 
2 asset | 0o24s Foésso | 08390 | 07879 | 67334 
3 ogg | 09841 | 09710 | 09529 | 0.92% | 6,407 
203 d 0,399Ù Û.99%4 | O.93$4 | (09891 OE17 | 09710 
s D,58uu 0,9997 | (,9991 LCUCLE (SKK | 0,937 
& I 0,999 | cygu7 | 0.994 | 09987 
7 1 1 9229 | 09998 
# L ! 
Él 
(0 0.5455 nd | Gl3 | 01154 | 00820 | 9,199! 
L 0.8794 05535 | 04555 | 036% | 02948 | 0,2343 
ri 0,9783 D$1E5 | 07324 (LEE 0,5654 | dus35 
3 0,9971 09392 | nésta | Quasu | 0842 | 07178 
30) 4 0,93 09444 | 09685 | 09447 | 09126 | 0,721 
5 1 09967 | (9421 (LIESR 0.9707 | 49519 
& 0,9964 | 09981 | 090060 | uggis | 0,848 
7 0,9999 | 09997 9492 Û0,4380 | 09955 
F 1 09999 | 998 | (JM | CHI 
y | L goss | 09008 
iQ | 
ii 
ü 0,364 120 | ouvrés | 00453 | 040266 | 0.155 | 9.0090 
1 07358 G400s | 02794 | 01900 | 01265 | 044627 | 0053 
2 Qué C,6767 SOS | (4162 QLATÉH Ô0.2260 | O.Lo0S 
a 0.9822 08609 | o760a | 06473 | 05227 | 04553 | 0,330 
50| 4 UE 05510 | 08964 | Os206 | qu | o,2au | 05277 
5 0,9995 0Sasé | 0622 | 09224 | téasc | 07914 | O7u7t 
ëä 0,5998 0,996 | (982 | 0971 | 9417 | 08981 | 08404 
7 1 1,9992 09965 5 CTKK | 9780 ES562 | 993127 
4 gogus | 'oooga | 09973 À 09927 | (9844 | GT2 
3 il CSSS | OH ŒUFTA QU | USTS 
1û L ŒUSE E Id 0985 | Q0S7 
Il L 09969 | 0,9999 | 09087 
13 Ï 09669 | (5096 
13 l 45999 
F4 1 
15 
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sell 


0.346 
0.736 
0.9298 
0,9472 
Q,99K4 


Ü,9999 
I 


8,1216 
0,317 
Q,6769 
08670 
05568 


O,FBET 
Q,9976 
CU 
qe 
1 


(HOM24 
1857 
O4 14 
HRÉTES 
(LR2AS 


05268 
09742 
9927 
0,998} 
Os 


9949 
l 


0,002 
OLA3E 
QLI1T 
0,2503 
f.4412 
CRÜTEL 
CT 
CETTE 
AOF 
40755 


LA LS 
DER 
EX) 
DH 
CHI 
i 
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Table 4 
Loi de Poisson 


Ci 
Probabilités individuelles Pr(k}= 67" en 


06065 
0,3033 
GTS 
00126 
LL étlé 


a,0002 


k 
Probabilités individuelles Pr(k)= 87" a 

È m=i.û m=l,s m=ti 

û G,2678 1.223t Q,+454 OUR 2 DRNEUE RREEINrA LAURE ût111 
1 ouero | osas | ot | oaas2 | outao4 | ouns7 À ao | oasa 
2 O1 PNA AATÔOT 1,264 (1.424104 D,1$50 t1d6s Q 1125 
3 0,013 01255 LA LUE 1,2134 ,2341) D,2154 01554 167 
4 doisa | our | ongoz | oué | ouéeo À ounsa | oo À io 
3 QUI 00141 LLRTEN EE UD QIUCS 0,1377 G,1561 AL 
ë CLCKHIS HAUTE R] RCE HAE AALAIFES D,0771 4,104 LVL 
7 dog | oc | out | ace | aagie | ovaus | ass À adea 
Ë LEP PIE LES CLARA EE APR 00169 LACET ET DATE 
3 LR TL UE LAN REC Q.U027 QJQ0eG G013: 1232 
FUI] LENFILI FA OLA (0073 00073 Hi 
11 LEXTTN RES OUT G,0018 HAUTE EI 
là LCA] OO L'ARFIL o,016 
L3 onoot | 00002 | ox 
14 G0001 | 00602 
15 DOGU1 
16 
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QE 


Dot 
CANLL 
0.972 
0.207 
414 
ÉTÉ 
AL ER 
134 

[RE] 


2.6 
2.60 
A 
337 
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Table 6 
Fractiles d’ordre P de la loi de Student T, 
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Table 7 
Fractiles d’ordre 0,95 de la loi de Fisher-Snedecor F(v,,v) 
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ET 2 ON LA a ie Peu mm 2 OC CE 


SO LA OL Fu 


Table 7 (suite) 
Fractiles d’ordre 0,975 de la loi de Fisher-Snedecor F(v,,v) 
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Abaque 2 
Intervalles de confiance pour une proportion p 
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arrangement 20 
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Bayes (méthode de) 253, 257, 267 
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erreur de première espèce 257 

erreur de seconde espèce 257 

erreur quadratique moyenne 201, 
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espérance conditionnelle 110 

estimateur du maximum de vraisem- 
blance 206 

événement 5, 7 

événement certain 7 

événement élémentaire 6 
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exhaustive (statistique) 224 
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exhaustive minimale (statistique) 
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exponentielle (famille) 227 
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Fisher (information de) 203, 213, 
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loi normale 216 

loi sans mémoire 104 
loi uniforme 80, 97, 137 
loi uniforme discrète 11 
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lois sans mémoire 98 
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